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Presentation 



Le laboratoire de traitement du langage et de la parole de Tuniversite 
de Neuchatel a 6te fond6 en 1987. Ses activit6s portent d’une part sur la 
psycholinguistique exp6rimentale, k savoir la perception, la 
comprehension et la production du langage chez Tetre humain, et d'autre 
part sur le traitement automatique (linguistique informatique), soit la 
synthase et la reconnaissance de la parole ainsi que Tanalyse automatique 
du langage 6crit. Le laboratoire est h la fois un centre de recherche 
(recherche fondamentale et appliqude) et un lieu d*enseignement. En 
effet, les etudiants de linguistique, d*orthophonie et des sciences du 
langage de I’universitd y sont accueillis lors des cours et seminaires ainsi 
que pour y pr6parer mdmoires et theses. 

Apres sept ans d’activite soutenue, nous avons propos6 au comit6 de 
redaction des TRANEL de consacrer le numero 21 de la revue aux 
travaux du laboratoire, ce qui a et6 accept^. Certaines recherches ont d6j^ 
fait I’objet de publications (voir la section IV) mais de nombreuses autres 
meritent d’etre diffusdes plus largement sous forme d’articles. Le num6ro 
contient done vingt et une presentations redigdes en fran^ais et parfois en 
anglais par les collaborateurs du laboratoire ainsi que par certains 
etudiants qui y ont prepare leur memoire. Neuf articles portent sur la 
psycholinguistique, cinq sur I’orthophonie et sept sur le traitement 
automatique du langage. A la suite de ces presentations, qui remplissent la 
quasi-totalite du numero, nous avons ajoute les resumes des articles qui 
ont dej^ ete pubues ou qui vont paraitre avant la fin de I'annee. En fin de 
volume, se trouve egalement la liste des memoires et theses prepares, en 
partie ou en totalite, dans le cadre du laboratoire ainsi qu'une breve 
description des mandats de recherche menes ^ bien jusqu'^ ce jour. 

Les activites de recherche du laboratoire n’auraient pas pu avoir lieu 
sans le soutien de nos coliegues (de linguistique, des sciences du langage, 
de la facultd en gdndral), ni sans les encouragements des autoritds 
universitaires (ddcanat, rectorat, ddpartement de I’instruction publique) et 
de diverses personnalitds de la Cite. Qu’ils re^oivent ici I’expression de 
notre reconnaissance. De plus, ces travaux ont bdndficid de subsides d’un 
certain nombre d’organismes que nous tenons ^ remercier : la CERS 
(subside no. 2054.2), le FNRS (12-33582.92, 32-37276.93), le National 
Science Foundation, Etats-Unis (BNS-8404565) et I’Agence de 
coopdration culturelle et scientifique, France (422-99-05). 




7 



8 



La preparation de ce numero a requis un travail considerable de 
correction et d'edition que Mme Jacqueline Gremaud-Brandhorst et Mme 
Corinne Tschumi ont accompli avec s6rieux, patience et amabilite. 
Qu'elles acceptent I'expression de notre reconnaissance la plus sincere. 
Nous aimerions 6galement remercier Mme Esther Py et Mme Madeleine 
de Seidlitz qui nous ont aid6s lors des diverses 6tapes de ce travail. 

Nous terminons en offrant ce num6ro k tous ceux et celles qui ont 
participe aux activit6s du laboratoire depuis sa creation, qui y ont parfois 
decouvert un nouveau champ d'etude ou une nouvelle demarche, qui ont 
persist^ malgr6 divers obstacles scientifiques et techniques et qui nous ont 
fait confiance tout au long de leur sejour parmi nous. 



Fran 9 ois Grosjean 





Travaux de psycholinguistique 



TRAN EL (T ravaux neuchdtelois de linguistique), 1994, 21, 11-20. 
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Enchainement des mots et acc^s au lexique en fran^ais^ 
Carole Besson 

R4sum4 

L’enchamement, et plus particulidrement la liaison, repr^sente un 
phdnomdne frequent en fran 9 ais oral et peut mener certaines fois k des 
ambiguYtds lexicales. Les modules d'accds au lexique actuels sont bas6s sur 
I’anglais et ne cherchent done pas ^ rendre compte de tels ph^nom^nes. 
L’^tude exploratoire que nous avons entreprise avait pour objectif de 
determiner le "taux d'ambiguite” de suites de mots enchaines avec liaison (ex. 

’’petit ami" qui peut etre interpret^ comme ’’petit tamis") et sans liaison (ex. 
’’chaque ours’’ qui peut etre interpret^ comme "chaque course"). Les rdsultats 
obtenus confirment que renchamement, et en particulier la liaison, peut cr^er 
une r^elle ambiguiie pendant la perception de la parole. 

1. Introduction 

La parole continue est affect6e par des phenom^nes d'enchainement 
qui se traduisent par des processus de sandhi externe ou ajustements 
phonologiques entre les mots de la chaine parlee. Les syllabes ouvertes 
predominent en franfais et les fronti^res syllabiques ont presque toujours 
la priorite sur les fronti^res lexicales (ex. "cette arme" : /se-tarm/ et non 
/set-arm/). L’enchainement, qui est Tun de ces processus phonologiques, 
comprend k la fois I’enchainement avec liaison et I'enchainement sans 
liaison. Ces deux types d’enchainement consistent k lier une consonne en 
finale de mot avec la voyelle ou la consonne du debut du mot suivant. La 
difference entre les deux types d’enchainement est la suivante : dans le 
cas de I’enchainement sans liaison, la consonne en finale de mot est 
toujours prononc6e, meme devant une autre consonne ou en isolation, 
alors que dans le cas de I’enchainement avec liaison, la consonne en finale 
de mot n’est prononc6e que devant une voyelle ou un h ”muet”. 

A notre connaissance, seules deux 6tudes ont examine I’effet de 
I’enchainement sur la reconnaissance des mots. Toutes deux ont 6te 



^ Cette 6tude a pu etre entreprise et men^e h bien grace ^ un subside du FNRS 
(12-33582.92). 
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menses afin de rendre compte de la difficult^ que les apprenants 
rencontrent face ^ 1‘apprentissage du fran 9 ais. Matter (1986) a tente de 
repondre ^ la question suivante : est-ce que des phenomenes de sandhi 
comme la liaison, renchainement et 1‘elision retardent la reconnaissance 
de la parole en fran 9 ais i la fois chez les natifs et les non-natifs ? 
Plusieurs experiences ont conduites sur Tenchainement et la liaison a 
I’aide d’une tache de detection de phonemes. Les resultats significatifs 
obtenus sont les suivants : seule la liaison potentielle (ex. "grand talent" 
par rapport a "vrai talent") retarde la detection d'un mot commen 9 ant par 
A/. La liaison ("grand arbre") et I’enchainement ("grande amie") ne 
retardent pas la detection d’un mot commen 9 ant par /a/. En outre, dans 
toutes les experiences, les sujets non natifs ont mis plus de temps pour 
faire la tache de detection que les sujets natifs du fran 9 ais. Enfin, I’auteur 
met en doute la tache utilisee, et de ce fait, ne peut pas tirer de 
conclusions tres probantes. Bradley & Dejean de la Batie (1990), quant a 
eux, ont utilise le meme materiel que Matter et ont etudie comment deux 
groupes d’auditeurs (sujets de langue matemelle fran 9 aise et etudiants du 
fran 9 ais langue etrangere) etablissaient des frontieres de mots en fran 9 ais. 
Les sujets devaient detecter le phoneme /t/ en debut de mot. Les auteurs 
ont obtenu des resultats, pour les deux groupes reunis, qui sont 
semblables ^ ceux de Matter, a savoir des temps de reaction plus longs 
pour "grand talent" que pour "vrai talent". Ils n’en concluent rien, 
cependant, sur la reconnaissance des mots enchaines. 

A I’exception de ces deux etudes qui portent surtout sur la 
perception de la parole chez les apprenants, les chercheurs ne se sont 
guere penches sur I’effet de Tenchainement lors de faeces au lexique en 
parole continue, que ce soit en fran 9 ais ou dans une autre langue. Des 
lors, il nous a paru important d’explorer cette voie dans le cadre de la 
recherche sur faeces au lexique. Non seulement nous voulions nous 
assurer que la reconnaissance de mots enchaines peut poser un probleme 
au niveau de la perception mais nous desirions egalement savoir si les 
difficult^s sont differentes selon le type d’enchainement. Pour ce faire, 
nous nous sommes int^ress^s a trois types d'enchainement. Un 
enchainement avec liaison du type "son oeuf (que nous repr^senterons 
dorenavant par le sigle E/L-cv) et deux types d’enchainement sans 
liaison : fenchainement entre la consonne finale d’un mot et la voyelle du 



C. Besson 13 



debut du mot suivant comme dans "chaque ours" (sigle : E-cv), .et 
renchainement entre la consonne finale d’un mot et la consonne initiale 
du mot suivant comme dans "neuf lames" (sigle : E-cc). II est h noter que 
dans notre etude chaque type d’enchainement peut conduire h une 
ambiguite lexicale complete. En effet, dans les exemples ci-dessus, les 
suites peuvent etre interpr^tees de deux manieres differentes : "son oeuf 
/ "son neuf, "chaque ours" / "chaque course", "neuf lames" / "neuf 
flammes". Ce type d'ambiguite, ou le deuxieme element de la suite est un 
mot possible, avec ou sans la consonne d’enchainement, est plus rare que 
rambiguit6 momentan6e cr6ee en d^but du deuxieme mot mais ensuite 
r6solue avant la fin de celui-ci (ex. "nain" dans "un instrument", "tas" 
dans "6tait arriv6", etc.). 

Dans cette etude exploratoire qui prelude a un programme de 
recherche plus consequent (voir Besson & Grosjean, 1994), nous avons 
mene une exp6rience de discrimination dans laquelle nous avons pr6sent6 
a des sujets des segments de phrases contenant des suites de mots 
enchames (ex. "II s’agit de son oeuf") et leur avons demande de nous 
indiquer la provenance de ces segments. Ils avaient le choix entre les deux 
interpr6tations possibles ("II s’agit de son oeuf’ et "II s’agit de son neuf’). 
Nous avons fait I’hypothese que les suites de la cat6gorie E/L-cv seraient 
discriminees avec difficult6. Quant aux suites du type E-cc, elles seraient 
discrimin6es assez facilement. Par contre, nous ne savions que dire des 
suites E-cv, car celles-ci partagent avec les suites E/L-cv le fait qu'il s’agit 
d’un enchamement entre la consonne finale d’un mot et la voyelle du mot 
suivant (ex. "chaque ours"). Mais elles sont egalement proches des suites 
E-cc, car il s'agit d’un enchamement et non d’une liaison. Par consequent, 
les suites E-cv pourraient se comporter d’une maniere similaire aux suites 
E/L-cv ou aux suites E-cc ou encore representer une categorie 
interm6diaire. 

2. M^thode 

Sujets : Seize sujets monolingues, dont la langue premiere est le frangais, ont pris 
part k I'exp^rience. 

Matiriel : Vingt-quatre suites de deux mots ont r^parties en trois groupes de 
huit» chaque groupe correspohdant aux trois categories d'enchamement indiqudes ci- 
dessus : enchamement E/L-cv, ex. "son oeuf ; enchamement E-cv ; ex. "chaque ours" ; 
enchamement E-cc, ex. "neuf lames". Dans chaque groupe nous avons apparid chaque 
suite avec enchamement h la suite correspondante sans enchamement, ex. "son oeuf 
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(suite AE) appari^e ^ "son neuf’ (suite SE), "chaque ours" (suite AE) h "chaque course" 
(suite SE), etc. Avant d'int^grer ces suites dans un contexte plus large, nous nous 
sommes assures que les trois groupes de suites ne diff^raient pas les uns des autres au 
niveau des variables suivantes : la frequence du deuxi^me mot de la suite (ex. "oeuf’, 
"neuf, "ours", "course") ; le point d'unicit^ du deuxi^me mot ; et la coherence 
s^mantique entre le premier et le deuxi^me mot de la suite (ex. "son oeuf, "son neuf, 
"chaque ours", "chaque course", etc.). Les suites ont ensuite ^t^ int^gr^es dans un 
^nonc^ de deux phrases. La premiere ^tait une phrase introductive du type, "Cela a ^veill^ 
notre int^ret", et la deuxi^me ^tait une phrase qui commen 9 ait avec "II s’agit de", qui 
continuait avec la suite en question et qui se terminait avec un syntagme pr^positionnel. 
(Ce syntagme ^tait ajout^ afin de s'assurer que la suite serait dite avec une prosodie de 
continuation). Ainsi, la suite "son oeuf se retrouvait dans I'^nonc^ suivant : "Cela a 
^veill^ notre int^ret. II s’agit de son oeuf de pigeon probablement", et "son neuf ^tait 
ins^r6 dans : "Cela a ^veill? notre int^ret. II s'agit de son neuf de carreau probablement". 

Dans ce qui suit, nous ferons reference aux parties suivantes des enonc^s : 

- Segment AE (segment stimulus avec enchatnement) ; ex. "II s’agit de son oeuf 

- Segment SE (segment stimulus sans enchatnement) ; ex. "II s'agit de son neuf 

- Suite AE (suite avec enchatnement ); ex. "son oeuf 

- Suite SE (suite sans enchatnement) ; ex. "son neuf 

Une lectrice fran?aise a lu les 48 enonc^s (24 avec enchatnement et 24 sans) a un 
debit normal. Aucune instruction n'a donnee quant a la prononciation de la consonne 
d'enchatnement afm de refl^ter le plus possible une situation naturelle. Les ^nonc^s ont 
ensuite ^t^ digitalises k I'aide du logiciel MacAdios et les segments stimuli en ont 6t6 
extraits (ex. "II s'agit de son oeuf..", "11 s'agit de son neuf..", "II s'agit de chaque 
ours..", "II s'agit de chaque course...", etc.). Ceux-ci ont ensuite ete enregistr^s sur deux 
bandes diff^rentes, chaque bande comportant 24 segments, douze segments AE et 12 
segments SE. Les ^l^ments d'une paire (segment AE et segment SE) se trouvaient 
toujours sur des bandes diff^rentes. Bien que nous n'^tions int^ress^s que par les 
segments AE (qui sont k I'origine de notre etude), nous avons utilise tous les segments 
(AE et SE) car il fallait que les sujets puissent entendre chaque Element d'une paire et faire 
un choix entre I'une ou I'autre des interpretations. 

Procedure : Les sujets ont ecoute les deux bandes k I'aide d'un magnetophone k 
cassette et d'^couteurs, k 24 heures d'intervalle. Ils devaient indiquer si le segment 
present^ correspondait k I'une ou k I'autre des deux versions pr^sent^es par ecrit. Ils 
devaient ^galement donner un degr^ de confiance pour chaque r^ponse sur une ^chelle 
allant de 1 (tr^s peu sur) k 10 (tr^s sur). 

Analyse des donnies : Nous n'avons analyse que les resultats des segments AE 
pour lesquels nous avons obtenu deux mesures : 

1) Taux de discrimination : Etant donne que pour un segment AE, le sujet avait le 
choix entre la version ecrite avec enchatnement (reponse AE) et la version ecrite sans 
enchatnement (reponse SE), nous avons calcuie un taux de discrimination pour chaque 
segment AE en prenant le nombre de reponses AE et en y soustrayant le nombre de 
reponses SE. Par exemple, pour le segment AE, "II s'agit d'un ancien hectare", 6 sujets 
ont choisi la reponse AE et 10 sujets ont choisi la reponse SE ; le taux de discrimination 
est done de 6 - 10 = -4. Pour le segment AE, "II s'agit d'une grande anse", 16 sujets ont 
choisi la reponse AE et aucun n'a choisi la reponse SE ; le taux de discrimination est 
done de 16 - 0 = 16. Une valeur positive et eievee signifie que la phrase a ete 
discriminee facilement et que les sujets ont choisi la reponse qui correspond au segment 
AE. Une valeur negative et eievee signifie que la phrase a egalement ete discriminee 
facilement, mais que les sujets ont choisi la reponse qui correspond au segment SE. Une 
valeur proche de 0 signifie que la phrase a ete entendue autant de fois comme AE que 
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comme SE, et done qu'elle est plus ambigue. La valeur maximale est de 16 et la valeur 
minimale de -16, 

2) Degr6 de confiance : Pour chaque r^ponse propos6e, le sujet a donn6 un degr6 de 
confiance, que nous avons analyst tel quel, sans tenir compte de son choix de segment 
(AE ou SE). Nous avons done simplement ealeul6 la moyenne de ehaque segment sur 16 
sujets. Plus la valeur est haute, plus les sujets sont eonfiants dans leur ehoix. La valeur 
maximale est de 10 et la valeur minimale de 1, 

3. R^sultats et discussion 

La Figure 1 (ci-dessous) montre le taux de discrimination des 
segments AE en fonction de la cat6gorie d'enchainement : enchainement 
avec liaison (E/L-cv), enchainement (sans liaison) entre la consonne finale 
d'un mot et la voyelle du debut du mot suivant (E-cv), et enchainement 
(sans liaison) entre la consonne finale d'un mot et la consonne initiale du 
mot suivant (E-cc). 




Figure 1. Taux de discrimination des segments AE en fonction de trois categories 
d'enchainement : E/L-cv, E-cv, E-cc. 



Noiis remarquoris qiie \cs segments de la categorie E/L-cv sont moins 
bien discrimines, en moyenne,. que les segments des categories E-cv et E- 
cc (moyennes de 4.75, 14 et 15, respectivement) et que les deux demieres 
categories donnent des r6sultats semblables. Une analyse de variance par 
mot et par sujet confirme cette observation (par mot : F (2, 21) = 26.90, 
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p < 0.001 ; par sujet : F (2, 30) = 42.04, p < 0.001). Une analyse post 
hoc (par sujet) montre une difference significative entre la categorie E/L- 
cv et la categorie E-cv et entre la categorie E/L-cv et la categorie E-cc, 
mais pas de difference entre les categories E-cv et E-cc. 

Nous pouvons conclure que les segments qui contiennent des 
enchainements avec liaison sont moins bien discrimines, et par 
consequent, sont plus ambigus que les segments qui contiennent des 
enchainements sans liaison. 

La Figure 2 (ci-dessous) montre le degre de confiance dans les 
reponses donnees en fonction des trois categories d'enchainement : E/L- 
cv, E-cv et E-cc. 




CATEGORIE D'ENCHAINEMENT 

Figure 2. Degres de confiance dans les reponses donnees en fonction de trois 
categories d'enchainement : E/L-cv, E-cv, E-cc. 



Nous observons des effets similaires k ceux obtenus pour le taux de 
discrimination. Premierement, les segments de la categorie E/L-cv ont un 
degre de confiance plus bas, en moyenne, que les segments des categories 
E-cv et E-cc (moyennes de 5.41, 8.29 et 8.17, respect! vement) et 
deuxiemement les segments des deux categories d'enchainement sans 
liaison presentent des resultats presque identiques. 
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line analyse de variance confirme ces observations (par mot : F (2, 
21) = 26.72, p < 0.001 ; par sujet : F (2, 30) = 60.03, p < 0.001). Une 
analyse post hoc (par sujet) montre une difference significative entre la 
categorie EA--cv et la cat6gorie E-cv et entre la categorie EA--cv et la 
cat6gorie E-cc, mais pas entre la categorie E-cv et la categorie E-cc. Cette 
deuxieme mesure (degre de confiance) confirme done les r6sultats 
obtenus avec le taux de discrimination. 

Nous retenons de cette 6tude que I’enchainement avec liaison (E/L-cv) 
est potentiellement plus ambigu que I'enchainement sans liaison, que ce 
dernier soit I’enchainement entre la consonne finale d’un mot et la voyelle 
du d6but du mot suivant (E-cv) ou celui entre la consonne finale d’un mot 
et la consonne initiale du mot suivant (E-cc). Etant donne ces differences 
dans I'ambiguite des suites, nous pouvons emettre I’hypothese que I’acces 
au lexique se fera avec plus de difficult^, et done plus lentement, pour les 
suites ambigues du type E/L-cv que pour les suites des deux autres 
categories. 

4. Discussion g^n^rale 

Bien qu’il faudra confirmer ces r6sultats avec une tache de 
reconnaissance des mots en temps reel (voir Besson & Grosjean, 1994), 
nous pouvons deja envisager la maniere dont les modeles actuels d’acces 
au lexique pourraient rendre compte de la reconnaissance des mots 
enchames. Le modMe de la cohorte (Marslen-Wilson, 1987) aurait 
quelques difficultes a le faire car I’activation des candidats se fait a partir 
du debut du mot (meme si cela est moins explicite que dans la premiere 
version du modele, Marslen-Wilson & Welsh, 1978) et la reconnaissance 
de plusieurs mots demeure une operation s6quentielle. Or, ce qui pourrait 
se passer au debut du deuxieme mot dans une suite comme /patitami/ n’est 
pas clair. Nous voyons deux possibilites qui semblent s’exclure 
mutuellement. Dans la premiere, la suite de sons /pati/ est d’abord 
reconnue comme etant le mot ’’petit” et les sons qui suivent (ex. /ta/) 
activent tous les mots qui commencent de cette fa 9 on. Mais cette maniere 
de faire empechera (ou retardera) la reconnaissance du mot "ami”. Dans 
la deuxieme possibilite, la suite de sons /patit/ est d’abord reconnue 
comme etant soit ’’petite" soit "petit" (il faudrait dans ce cas inclure une 
disposition speciale pour les consonnes de liaison), et les sons suivants 
/am/ activent alors les mots qui commencent ainsi. Or, le probleme 
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maintenant est que la reconnaissance de "tamis" sera soit empech6e, soit 
retard6e. Par consequent, nous voyons mal comment le modele de la 
cohorte peut rendre compte de la reconnaissance de mots enchaines. 

Nous avons besoin d’un modele qui soit moins s6quentiel (qui ne 
stipule pas que la reconnaissance se fait mot par mot, un mot apres 
I’autre) et qui permette Tactivation de candidats a partir de plusieurs 
endroits dans la chaine sonore. De plus, le module doit accepter la 
reconnaissance de plusieurs mots a la fois. Malgr6 certaines critiques qui 
lui sont faites (organisation temporelle, absence de liens avec les niveaux 
superieurs, etc.), le module TRACE (McClelland & Elman, 1986) semble 
capable de rendre compte du traitement d'une suite ambigue qui decoule 
de la presence d’un enchatnement (avec quelques legeres modifications 
eventuellement). 

Prenons a nouveau Texemple de /patitami/. L’information du debut de 
la suite active des candidats qui correspondent aux elements acoustico- 
phonetiques per^us. Comme nous pouvons le voir sur la Figure 3 (page 
suivante), lorsque nous arrivons a la fin de /pati/ (fleche no. 1 sur le 
diagramme), un certain nombre de candidats sont deja actifs : "petit", 
"petite", "petite-fille", "petit-beurre", etc. Bien que TRACE ne tienne pas 
compte de la frequence, nous avons arrange les candidats selon leur 
frequence dans I’exemple, les plus frequents en haut de la liste, les moins 
frequents en bas. "Petit-gris" sera done moins actif que "petit" ou 
"petite". Au fur et a mesure que I’information phonetique continue 
d’arriver, de nouveaux candidats sont actives alors que d'autres perdent 
de leur activation (ils sont barres dans le diagramme). Quand on arrive a 
la fin de la sequence /patita/ (fleches 2a, 2b et 2c), "petit" et "petite" sont 
clairement actifs (fleche 2a) et "tamis" et "ami(e)" entrent en competition 
(fleches 2b et 2c). Si ces deux concurrents etaient de meme frequence, 
seul le contexte pourrait les departager, mais dans notre exemple, "ami" 
etant beaucoup plus frequent que "tamis", il sera plus actif et done 
inhibera probablement "tamis". (Pour que "tamis" soit reconnu a la 
longue, il lui faudra I’aide du contexte). Enfin, lorsqu'on atteint la fin de 
la sequence /patitami/ (fleches 3a et 3b), les candidats qui demeurent sont 
ceux qui correspondent directement a celle-ci ("petit" et "petite", "ami", 
"amie" et "tamis") ainsi que ceux qui seraient eventuellement possibles 
avec une continuation adequate ("tas" si les mots suivants 6taient 
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Figure 3. Le d^roulement de la reconnaissance de la suite /pdtitami/ 
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"miniature”, "miserable”, "mis”, etc. ; "amiral" si la suite se poursuivait 
avec /ral/, etc.). Ce qui est interessant dans I'exemple donn6 est que "ami" 
et "amie" sont les premiers candidats (pour des raisons de frequence) 
mais ^galement que "tamis" reste candidat, certes moins actif, tant que 
d'autres informations (ascendantes ou descendantes) ne viennent les 
departager. 

Par consequent, plus I'information acoustico-phon^tique permet de 
distinguer entre les candidats, moins il y aura de competition entre eux et 
plus rapidement un seul candidat sortira du lot. C'est probablement ce qui 
se passe avec les suites qui appartiennent aux categories E-cv et E-cc. 
Dans I'exemple de /Jakurs/ ("chaque ours" ou "chaque course"), si I'indice 
acoustique au niveau du /k/ est en faveur de "chaque ours", alors "ours" 
sera plus active, "course" le sera moins, la competition sera moins intense 
entre les deux et "ours" sera reconnu plus rapidement. La rapidite de 
I’acces de mots enchaines dependra done, en dehors d'informations 
descendantes, du degre d'ambiguite de I'information acoustico-phonetique 
et, dans une moindre mesure, de la frequence des concurrents en 
question. 

Notons enfin que cette maniere de considerer la reconnaissance des 
mots avec enchainement permet d'eviter la presence de consonnes 
d'enchainement au niveau de la representation lexicale. En effet, on 
pourrait imaginer que I'entree d'un mot qui commence avec une voyelle 
soit representee par I’ensemble des suites phonetiques possibles dont celles 
avec liaison (ex. I'entree "ami" correspondrait non seulement a "ami" 
mais egalement a "zami", "tami", "rami" etc.). Mais cela accroitrait la 
taille du lexique de maniere considerable (il faudrait que toutes les 
possibilites y soient presentes) et integrerait au niveau de la representation 
un phenomene avant tout de production. Nous preferons done 
I'explication pr6sentee ci-dessus dans laquelle les elements enchaines sont 
reconnus lorsque les informations ascendantes et descendantes ont permis 
I’activation suffisamment forte d'une suite de deux representations 
lexicales. 
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L'apport de la coarticulation dans la perception 
de consonnes occlusives et constrictives 

Murielle Gigandet 



R^sum^ 



Cet article pr^sente les principaux r^sultats d’un travail qui ^tudie 
I’influence, au niveau de la perception, d’un phoneme sur un autre lorsque 
ces deux phonemes ne sont pas contigus. Nous avons demand^ ^ des sujets 
d'^couter des logatomes CVCV pr^sent^s dans le bruit et d’identifier les 
phonemes entendus. Les r^sultats montrent que I’influence perceptive ^ 
distance varie selon que le phoneme’ est le stimulus (i.e. consonne 
influen^able) ou le voisin (i.e. consonne influen^ante). L’influen 9 abilit^ et la 
force d’influence dependent de la consonne consid^r^e, de la forme 
d’influence et de la classe h. laquelle appartient I’^^ment consid^r^. 

1. Introduction 

Dans l’6tude de la perception de la parole, nombre de questions 
demeurent encore non resolues, en particulier la maniere dont sont 
identifi6s les phonemes dans la chaine parlee. Clark & Clark (1977) et 
Calliope (1989) nous proposent un module de perception dont voici les 
points principaux : a une premiere 6tape dite auditive oil le signal 
acoustique est trait6 dans sa repr6sentation spectrale et ses aspects 
temporels, succ^de une 6tape phonetique pendant laquelle sont extraits les 
indices acoustiques du signal qui sont ensuite combines afin d'identifier un 
phoneme particulier. L'etape suivante est l'6tape phonologique oil 
I’identification preliminaire du phoneme est ajust6e aux contraintes 
phon6tiques et phonologiques de la langue, ce qui permet d'acc6der 
ensuite k l’6tape de recherche lexicale qui n6cessite la prise en compte 
d’autres indices, extra-auditifs. 

Dans ce module de perception, le niveau qui nous int^resse plus 
particuli^rement est celui de l'6tape phonologique on I'auditeur va 
percevoir un phoneme en combinaison avec d'autres phonemes. La langue 
pr6sente en effet cette caract6ristique que les sons se combinent les uns 
avec les autres, mais surtout que cette combinaison implique une influence 
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mutuelle entre les sons. En production de la parole, cette influence est 
connue sous le nom de coarticulation : dans Tarticulation d’un son, on 
trouve des "traces" de Tarticulation d’un autre son voisin du premier, car 
le mouvement articulatoire d’un son commence et se poursuit dans les 
sons avoisinants. 

Cette influence se rencontre egalement au niveau de la perception 
comme le montrent plusieurs 6tudes. Van Dommelen (1983) met en 
evidence que dans un groupe de deux consonnes voisines, le voisement de 
la seconde consonne peut influencer la perception du trait de voisement de 
la premiere. Alfonso (1981) d6gage le fait que dans un contexte CVC, les 
deplacements de frontiere dans la perception categorielle du lieu 
articulatoire de la consonne initiale dependent de la perception de la 
consonne finale. Enfin, Van den Berg & Slis (1987) montrent que la 
variation du trait de voisement des consonnes initiale et finale, dans des 
logatomes de forme CVCCVC, affecte la perception du voisement du 
groupe des deux consonnes centrales. 

La plupart des etudes men6es jusqu’a present se sont concentrees sur 
la perception d’un trait particulier et non sur la perception "globale" d’un 
phoneme. De plus, les etudes faites sur le frangais sont rares, la plupart 
concemant I’anglais. On aimerait aussi savoir si toute consonne peut 
influencer toute autre consonne et, dans I'affirmative, comment se 
manifeste cette influence. La question de depart de cette etude est done la 
suivante : Comment la perception d'un phoneme est-elle influencee par la 
presence, dans la meme chaine parlee, d'un phoneme non contigu ? 

Pour etudier ces phenomenes d’influence, nous avons choisi une 
experience d’identifi cation de phonemes dans le bruit en nous inspirant de 
la recherche menee par Miller & Nicely (1955). Comme eux, nous avons 
analys6 les rdponses donnees aux stimuli proposes mais nous avons tenu 
compte, en plus, de la presence et de I’identite de I’autre phoneme contenu 
dans l’61ement pr6sent6. 
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2. M^thode 

Sujets : 1 1 sujets, 6 femmes et 5 hommes dont la moyenne d'age ^tait de 30 ans, ont 
pris part h Texp^rience. 

Matiriaux linguistiques : Nous avons utilise des logatomes de forme CVCV car les 
mots de deux syllabes sont des plus courants en fran 9 ais comme Test la sequence CV 
(54,5% d’apparition contre 1,9% pour les VC). Pour controler I'effet de frequence 
lexicale (la frequence des mots pourrait biaiser I'^tude dans le sens d'une meilleure 
perception des mots connus ou du remplacement par un phoneme qui donnerait un mot 
connu), nous avons choisi pour voyelle le ”e muet" ou ’’schwa", de fr^uence tr^s faible 
(0,4% d’occurrence), ce qui permet d’avoir un maximum de logatomes. 

Nous avons limits le nombre de phonemes ^tudi^s h douze et notre int^ret a port^ sur 
les consonnes occlusives (/b/, /d/, /g/, /p/, /t/, /k/), et sur les consonnes constrictives 
simples (/v/, /z/, /j/, /f/, /s/, /ch/ ; "j" et "ch" sont utilises ici par convention comme 
symboles des deux chuintantes sonore et sourde). 

Les stimuli de I’exp^rience ont ^t^ construits de la mani^re suivante : nous avons 
enregistr^ 144 logatomes (c.^.d. toutes les combinaisons possibles de CVCV ou les C 
peuvent etre chaque fois 12 consonnes diff^rentes), puis nous les avons digitalises et 
nous leur avons ajoute du bruit. Ces stimuli ont ensuite 6i6 repartis al^atoirement en 8 
listes de 18 logatomes en moyenne puis reenregistres sur cassette. Nous avons ajoute du 
silence entre chacune des 8 listes. 

Procedure : Nous avons demand^ aux sujets d'^couter les stimuli, de noter d'abord 
la seconde consonne entendue dans le logatome, puis dans une seconde ^coute, la 
premiere consonne entendue. Les sujets n’ont eu ainsi h. se concentrer que sur une 
consonne h. la fois et nous avons pu tenir compte des deux effets possibles dans le 
logatome CVCV : la premiere consonne peut influencer la seconde et inversement. Nous 
avons donn^ aux sujets une liste des phonemes possibles comme r^ponses. 

Analyse des donnies : Comme le nombre de r6ponses ^tait important (11 sujets ont 
^cout^ 12 consonnes-stimuli en fonction de 12 consonnes-voisines dans 2 positions 
diff^rentes ce qui donne 3168 r^ponses), nous avons eu recours h. I’informatique pour 
nous aider dans nos calculs. Nous avons done construit une base de donn^es dans 
laquelle nous avons entr6 tous nos r^sultats. Nous avons donn6 pour chaque item les 
r^ponses de chaque sujet, en notant chaque fois les traits de voisement et de mode de 
chaque consonne, aussi bien dans les stimuli que dans les rdponses ; nous avons ensuite 
effectu6 tous les comptages n^cessaires en errant des programmes de calcul h partir de la 
base de donn^es ; puis nous avons transform^ ces rdsultats en pourcentages, et enfin nous 
avons calculi diff^rentes statistiques (correlations, tests de signification, etc.). 

L'influence mutuelle entre phonemes peut etre envisag^e sous deux angles : un 
phoneme peut en influencer un autre, mais en meme temps ce phoneme peut etre influence 
par I’autre phoneme. II s’agit bien d'une influence mutuelle, ou chaque phoneme peut 
jouer h. la fois le role d'eiement influen^ant et celui d'eiement influengable. Deux types 
d'analyses doivent done etre faites en paralieie : celle du stimulus ou consonne 
influen^able, et celle du voisin ou consonne influen 9 ante. De plus, I'identification de 
phonemes dans le bruit peut mener k deux types de r^ponses : soit le stimulus est per9u 
correctement, soit la r^ponse donn6e est diff^rente de ce stimulus et constitue ce qu’on 
appelle une confusion. Ceci implique que nos deux analyses parall61es component 
chacune deux parties : la premiere porte sur I’analyse des reponses correctes, la seconde 
sur les erreurs ou confusions. 
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3. R^sultats 

3.1. La consonne en tant que stimulus 

Nous aliens commencer par examiner la consonne en tant que 
stimulus, e'est-a-dire en tant que phoneme influen 9 able par un autre 
phoneme present dans le meme logatome. Nous considererons d'abord la 
perception correcte, autrement dit nous verrons si une consonne est mieux 
per 9 ue grace a la presence d'une autre consonne ; puis nous etudierons les 
erreurs ou confusions afin de constater de quelle fa 9 on un stimulus peut 
etre influence par la presence d'une autre consonne. 

a) Perception correcte : Le nombre total de r^ponses conectes est de 
1577, soit 50% du nombre total des r^ponses. Apres avoir calcule le 
pourcentage de reponses correctes sur un stimulus, il s'agissait de voir si 
ce pourcentage est identique quelle que soit la consonne-voisine qui 
accompagne ce stimulus dans le logatome pr^sente. Nous avons done 
examine les pourcentages en fonction de chaque voisin et avons calcule si 
les differences entre ces pourcentages etaient significatives^ Si tel est le 
cas, cela veut dire que la perception correcte du stimulus implique depend 
de I’identit^ du voisin present dans le meme logatome. 

Pour faciliter I'analyse, nous avons regroup^ les voisins selon les 
traits de voisement et de mode. Nous avons choisi ces deux traits parce 
qu’ils permettent de regrouper les consonnes en deux categories bien 
definies et d'importance egale (six sonores / six sourdes et six occlusives / 
six constrictives). Ainsi, nous avons compte, par exemple, pour le 
stimulus /b/, un pourcentage global de perception correcte de 50%, un 
pourcentage de 57% lorsque le voisin est sonore et de 44% lorsque le 
voisin est sourd ; la difference de pourcentages de 13% est ici 
significative. Par contre, le pourcentage est de 48% lorsque le voisin est 
occlusif et de 52% lorsque le voisin est constrictif ; la difference de 
pourcentages de 4% n'est pas significative. 

Une premiere analyse des r^sultats nous a indiqu^ les pourcentages de 
perception correcte des stimuli en fonction du trait de voisement du 

1 Tous les tests dans cet article ont utilise le test t de Student avec un niveau de 
signification de 0.05. Les resultats d6taill6s des tests se trouvent dans le m^moire de 
I'auteur (Gigandet, 1991). 
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voisin. La difference entre les pourcentages atteint un niveau significatif 
pour deux consonnes seulement : /b/ et /ch/. Une deuxieme fafon 
d’analyser les resultats a consist^ h, calculer les pourcentages de perception 
correcte des stimuli en fonction du trait de mode du voisin. Les resultats 
montrent qu'une seule consonne pr^sente une difference de pourcentages 
significative : il s’agit de /sA 

La Figure 1 (page suivante) montre le degr6 d’influen9abilit6 de 
chaque consonne dans la perception correcte. Ce degr6 a obtenu de la 
maniere suivante : on calcule la difference des pourcentages de perception 
correcte d’un stimulus selon le trait de voisement du voisin, puis on 
calcule la meme difference avec le trait de mode du voisin et enfin on fait 
la moyenne entre les deux differences. Cette moyenne correspond au 
degre d'influen 9 abilite. Plus le degre est eleve, plus le stimulus est 
influen 9 able. Les consonnes /b/, /s/ et /ch/ apparaissent comme des 
consonnes fortement influen9ables ; au contraire, /p/ et Izl subissent tr^s 
peu d'influence de la part de leur voisin. Nous pouvons done constater 
que seules quelques consonnes semblent etre influenc^es dans leur 
perception correcte par leur voisin non contigu mais cette influence ne 
porte pas sur les memes consonnes selon que Ton considere un trait 
different du voisin (voisement ou mode). 

b) Erreurs (confusions) : Nous allons k present prendre en 
consideration les erreurs perceptives sur le stimulus et nous ferons 
I'hypothese que ces erreurs ne sont pas faites qu'en fonction de la 
consonne-stimulus mais aussi en fonction de la consonne-voisine. Nous 
avons decide de prendre comme mesure la force que possede un stimulus 
pour garder son trait bien qu’il soit remplace par une consonne erronee. 
Par exemple, pour /b/ stimulus, nous avons compte le nombre de reponses 
erronees qui etaient sonores comme /b/, done les cas ou la reponse ^tait 
/d/, /g/, /v/, Izl et /j/. C’est ce que nous avons appel6 le maintien du trait 
(dans les erreurs). L’hypothese que nous v^rifions ici est la suivante : un 
stimulus garde mieux son trait grace k la presence du voisin. Si les 
differences entre les pourcentages de maintien d’un trait en fonction du 
voisin sont significatives, I’influence du voisin existe. Le pourcentage de 
maintien est base sur le nombre total d’erreurs pour chaque stimulus. 
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Figure 1 : Degre d*influen 9 abilite dans la perception correcte 




Consonne (stimulus) 



Figure 2 : Degre d’influen 9 abilite dans les erreurs 
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Ainsi, nous avons pour /b/, un pourcentage global de maintien de 91%, un 
pourcentage de 41,5% lorsque le voisin est sonore, et de 49,5% lorsque le 
voisin est sourd. La difference de 8 % n’est pas tout ^ fait significative. 

Un premier calcul nous a indiqu 6 les pourcentages de maintien du 
trait de voisement du stimulus dans les erreurs en fonction du trait de 
voisement du voisin. Les stimuli /g/ et /ch/ presentent des differences de 
pourcentages significatives ; ils sont done influen 9 ables par la presence de 
leur voisin qui les aide a "garder une partie de leur identity" malgr 6 les 
confusions perceptives. Trois consonnes ont des resultats proches du 
niveau de signification : /b/, /d/ et /j/. .On peut 6 galement calculer les 
pourcentages de maintien du trait de mode du stimulus en fonction du 
trait de mode du voisin. Nous avons obtenu des differences significatives 
pour A/ et /f/ ; la consonne M a un resultat proche du niveau de 
signification. 

La Figure 2 (page precedente) montre le degr 6 d’influen 9 abilite de 
chaque consonne dans les erreurs (maintien du trait). Le degre 
d’influen 9 abilite est calcule en faisant la moyenne entre les differences de 
pourcentages de maintien du trait de voisement et du trait de mode du 
stimulus, /g/, /k/, /j/ et /ch/ apparaissent comme des consonnes 
influen 9 ables pour le maintien de leur trait dans les erreurs ; elles 
’’profitent” de Taide de leur voisin dans les erreurs qui se produisent pour 
garder leur trait, /p/ et /z/, au contraire, n'utilisent pas I'aide de leur 
voisin pour garder leur trait dans les erreurs. On peut remarquer que le 
degr 6 d’influen 9 abilite est plus 61eve pour les erreurs que pour la 
perception correcte (moyennes de 8,33 et 5,7 ; difference significative). 
Une consonne subit done plus d'influence de son voisin quand il se passe 
une erreur que dans la perception correcte. 

La Figure 3 (page pr 6 c 6 dente) montre le degre d'influen 9 abilite 
globale du stimulus. Ce degre est obtenu en calculant la moyenne entre le 
degr 6 d’influen 9 abilit 6 de la perception correcte (Figure 1) et le degr 6 de 
maintien du trait dans les erreurs (Figure 2). Nous pouvons observer les 
points suivants : /s/ et /ch/ subissent une forte influence de leur voisin ; 
elles profitent de leur voisin pour etre per 9 ues correctement ou, dans les 
erreurs, pour maintenir leur trait. A I’inverse, /p/ et /z/ apparaissent 
comme des consonnes peu influen 9 ables ; elles n'utilisent pas I'aide de leur 
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voisin pour etre mieux per 9 ues ou pour garder leur trait dans les erreurs. 
Notons 6galement que les consonnes posterieures (/j/ et /ch/, /g/ et /k/) 
sont parmi les consonnes les plus influen 9 ables ; elles ont un 
comportement plus homogene que les medianes et les anterieures. Enfin, 
la moitie des consonnes etudiees ont un degre d'influen9abilite de 8 ou 
plus, ce qui montre que I'influence de la consonne non contigue est assez 
importante. 

Nos conclusions a propos de l’6tude du stimulus sont les suivantes : a) 
une consonne peut etre influencee, dans sa perception, par une consonne 
non contigue ; b) toutes les consonnes 6tudi6es ne sont pas influen 9 ables au 
meme degre ; c) les consonnes influen 9 ables ne sont pas les memes selon 
la forme d'influence (perception correcte ou erreurs) ni selon le trait du 
voisin (groupes de voisement ou de mode). 

32. La consonne en tantque voisin 

Nous allons a present examiner la consonne en tant que voisin, 
autrement dit en tant que phoneme influen 9 ant la perception d'un autre 
phoneme present dans le meme logatome. Nous considererons d'abord 
I'aide a la perception correcte et verrons si une consonne permet, par sa 
presence, une meilleure perception des consonnes non contigues ; puis 
nous etudierons les erreurs et nous observerons quel genre d'influence un 
voisin peut avoir sur un stimulus lorsque celui-ci est remplace par une 
r6ponse erronee. 

a) Aide a la perception correcte ; Si I'influence d'un voisin sur un 
stimulus 6tait nulle, le pourcentage de perception correcte permis par un 
voisin devrait etre identique quel que soit le stimulus present dans le 
meme logatome. Nous avons regroupe les stimuli selon les traits de 
voisement et de mode et nous avons examine si le voisin influence 
davantage un groupe de consonnes-stimuli que I'autre et ceci de fa 9 on 
significative. Si les differences entre les pourcentages permis pour chaque 
groupe de consonnes-stimuli sont significatives, cela montre que le voisin 
agit de fa 9 on differenciee sur un stimulus selon le trait de celui-ci et done 
qu’il influence effectivement, par sa presence, I'identification du stimulus. 
Par exemple, nous avons obtenu un pourcentage global de perception 
correcte permise par le voisin /b/ de 54%, un pourcentage de 61% 
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lorsque le stimulus etait sonore, et de 47% lorsque le stimulus 6tait sourd. 
La difference de pourcentages de 14% est id significative. 

Un premier calcul nous a donn6 les pourcentages de perception 
correcte permis par les voisins en fonction du trait de voisement du 
stimulus. Nous avons obtenu une difference de pourcentages significative 
pour les voisins /b/ et /ch/, et des resultats proches du niveau de 
signification pour /v/, /f/ et /s/. Un second calcul a porte sur les 
pourcentages de perception correcte permis par les voisins cette fois en 
fonction du trait de mode du stimulus. Les differences de pourcentages 
daient significatives pour le voisin /j/. 

La Figure 4 (page suivante) montre le degre d’influence du voisin sur 
la perception correcte du stimulus. Ce degr6 est calculi sur la moyenne 
entre les differences de pourcentages de perception correcte permis par le 
voisin lorsqu’on considere le trait de voisement et de mode du stimulus. 
Plus la difference de pourcentages est elevee, plus le voisin est 
influengant. /j/, /v/ et /ch/ apparaissent comme des consonnes influen^ant 
fortement la perception correcte d'un stimulus. A noter qu’on retrouve 
/ch/ comme dans la Figure 1 (influengabilite du stimulus dans la 
perception correcte) ce qui montre qu'une consonne peut etre a la fois 
influengable et influengante. Par ailleurs, /p/ apparait comme peu 
influengante, comme elle 6tait peu influengable en tant que stimulus. Le 
degre d’influence est en moyenne plus eleve que le degre d'influen^abilite 
(7,1 contre 5,7). Le coefficient de correlation de Pearson entre le degr6 
d’influengabilite et le degr6 d'influence pour les 12 consonnes est de 0.33. 

b) Erreurs (confusions) : Nous allons considerer ici I'aide au maintien 
du trait, autrement dit la force que possede un voisin pour faire maintenir 
son trait au stimulus dans les erreurs. Par exemple, pour un stimulus 
sonore et un /b/ voisin, nous avons compte le nombre de r^ponses 
erron^es sonores ; puis, toujours avec le voisin /b/ mais avec un stimulus 
sourd, nous avons compte le nombre de reponses erronees sourdes. Nous 
avons transform^ les resultats en pourcentages afin d'examiner si la 
difference entre les pourcentages de chaque groupe 6tait significative. 
Nous avons trouv6, par exemple, que le pourcentage global d'aide au 
maintien du trait de voisement que foumit le voisin /b/ etait de 86%, qu'il 
6tait de 37% lorsque le stimulus etait sonore et de 49% lorsque le 
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stimulus etait sourd. La difference de pourcentages de 12% n'est pas 
significative. 

Un premier calcul nous a donne les pourcentages d’aide au mairitien 
du trait de voisement du stimulus dans les erreurs que foumit chaque 
voisin. Le pourcentage d’aide au maintien du trait est bas6 sur le nombre 
total d’erreurs foumies par le voisin. Nous avons trouv^ que les 
differences de pourcentages etaient significatives pour les voisins /v/, /f/ et 
/s/. Un deuxieme calcul nous a donne les pourcentages d’aide au maintien 
du trait de mode du stimulus dans les erreurs que foumit chaque voisin. 
Les diff6rences de pourcentages etaient significatives pour les voisins /p/, 
/vA /j/ et /s/ et tres proches de la signification pour /d/. On retrouve done 
/v/ et /s/ comme pour le voisement : ces deux consonnes semblent etre des 
voisins ayant une grande force d’influence sur le maintien du trait du 
stimulus dans les erreurs. 

La Figure 5 (page precedente) montre le degre d’influence du voisin 
sur le maintien du trait du stimulus dans les erreurs. Ce degre est calcule 
en prenant la moyenne entre les differences de pourcentages d’aide au 
maintien du trait de voisement et de mode du stimulus. Nous remarquons 
que /s/ et /v/ apparaissent comme des consonnes fortement influen 9 antes 
dans I’aide au maintien du trait du stimulus. On retrouve /v/ a nouveau 
(voir I’influence du voisin sur la perception correcte, Figure 4) ce qui 
implique que cette consonne possede une grande force d’influence. /t/, /k/ 
et /z/ apparaissent au contraire comme des consonnes peu influen 9 antes 
dans I’aide au maintien du trait, /k/ et /z/ apparaissaient deja comme telles 
dans la Figure 4, ce qui signifie que ces deux consonnes ont peu de force 
d’influence sur des consonnes non contigues. Le degre d’influence est 
legerement plus eleve pour les erreurs que pour la perception correcte 
(moyennes de 7,5 contre 7,06) mais cette difference n’est pas 
significative. 

Nous constatons done que seules certaines consonnes semblent etre 
influen 9 antes sur le maintien du trait du stimulus dans les erreurs, et que 
cette influence n’est pas due au meme voisin selon le trait du stimulus 
consider^. De plus, un voisin semble influencer davantage un stimulus 
quand il s’agit de I’aider k maintenir un trait que quand il s’agit de le faire 
percevoir correctement. Enfin, nous voyons deux fonctionnements 



32 Coarticulation dans la perception de consonnes 



diff^rents selon la forme d’influence : dans la perception correcte, une 
consonne est plus influen9ante qu’influen^able tandis que dans les erreurs 
elle est plus influen9able qu’influen9ante. 

La Figure 6 (page precedente) montre le degr6 d'influence global de 
chaqiie consonne en tant que voisin. Ce degre est calcule en prenant la 
moyenne entre les degres d’influence de I’aide a la perception correcte 
(Figure 4 ) et de I’aide au maintien du trait dans les erreurs (Figure 5 ). 
Nous pouvons noter les trois points suivants : quatre constrictives se 
trouvent parmi les consonnes les plus influen9antes dont /s/ et /ch/ qui 
etaient deja parmi les consonnes les plus influen9ables (voir Figure 3 ) ; /v/ 
est une consonne tres influen9ante mais peu influen9able tandis que /p/ et 
/z/ sont peu influen9antes et peu influen9ables ; enfin, la moyenne du 
degre global d’influen9abilit6 est de 7 et celle du degre global d'influence 
de 7,3 (difference non significative). La correlation entre les deux 
echelles donne un r de 0 . 30 . 

Nos conclusions concemant I’etude du voisin sont les suivantes : une 
consonne peut etre influen9ante sur la perception d'une consonne non 
contigue ; cette force d’influence est differente selon les consonnes 
considerees ; les consonnes influen9antes ne sont pas les memes selon la 
forme d'influence (perception correcte ou erreurs) ni selon le trait du 
stimulus (groupes de voisement ou de mode). 

Void nos conclusions generales aux etudes du stimulus et du voisin : 
dans I’ensemble, une consonne ne se comporte pas de la meme fa90n en 
tant que stimulus et en tant que voisin ; la relation entre influen9abilite et 
force d'influence depend de la consonne consideree ; le comportement 
d’une consonne face a une consonne non contigue est d'une grande 
complexite. 

4. Discussion g6n6rale 

Par notre etude de perception dans le bruit, nous avons cherche a 
savoir comment se pr6sente I’influence mutuelle entre deux consonnes non 
contigues. Nous avons constate qu’une consonne peut etre influencee, dans 
sa perception, par une autre consonne non contigue mais qu’elle peut aussi 
influencer la perception de cette autre consonne. Nous avons vu egalement 
que ces phenomenes dependent de la forme d’influence (perception 
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correcte ou erreurs) et du trait articulatoire des consonnes (groupes de 
voisement ou de mode). Nous avons aussi montr6 qu’il est difficile de 
d^gager de grandes classes ou categories de consonnes dont le 
comportement serait homog^ne dans tous les cas Studies. Et enfin, nous 
avons vu que la relation entre influen 9 abilite et force d'influence depend 
de la consonne consideree. 

Cette influence perceptive ^ distance, complexe et subtile, m6rite 
d'etre 6tudiee davantage. li serait int^ressant de modifier certains aspects 
de I’experience comme, par exemple, analyser les memes stimuli mais 
avec un autre trait comme celui du lieu d'articulation, tenir compte de la 
position du phoneme dans le mot, 6tudier d'autres consonnes, ou enfin 
utiliser d'autres stimuli que les CVCV. 

Des 6tudes comme celle que nous avons men6e ont leur importance en 
perception de la parole car, comme le disent Miller & Nicely (1955) : 

"On pourrait en savoir davantage sur la perception de la parole, et 
meme am61iorer la communication, si on savait quels types d'erreurs 
se produisent [...]" 

a quoi on pourrait ajouter : "et si on savait aussi pourquoi elles se 
produisent". 
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Continuum acoustique **camp-gant** 
obtenu par hybridation : 
fiche descriptive 

Francois Grosjean & Jean-Yves Dommergues 

R4sum4 



Nous d^crivons dans cette fiche la demarche que nous avons suivie 
pour construire un continuum acoustique "camp-gant" permettant de tester la 
perception cat^gorielle chez des sujets francophones. Ce continuum comporte 
douze topes obtenues en faisant varier la proportion du pr^voisement 
pendant la tenue de la consonne /k/ dans le mot "camp". Une ^tude 
d’identification pilote confirme qu'il existe une frontito perceptive nette k 
I'inttoeur du continuum. 

1. Procedure d'41aboration 

Le present continuum acoustique a 6te elabore a la demande de la 
Division de neuropsychologie du Centre Hospitalier Universitaire du 
Canton de Vaud (CHUV) afin d’etre utilise avec des sujets aphasiques. 
Cela explique l’int6gration des elements du continuum dans une phrase qui 
indique au sujet de choisir entre deux images situ6es devant lui. 

A. Le choix des phrases 

Les deux phrases retenues sont les suivahtes : ’’Montrez le camp” et 
"Montrez le gant”. Elies offrent la double caracteristique d’etre analogues 
aux phrases deja utilisees par le CHUV pour tester certains de leurs 
patients et de presenter en contexte phrastique les deux mots -clefs "camp” 
et "gant", qui ne se diff6rencient que par le trait "non-voise/vois6”. 

Elies ont 6te lues et enregistr6es en studio, chacune h. dix reprises, par 
une voix feminine. Elies ont ensuite €t€ 6chantillonnees h 10 kHz et 
digitalis6es k I’aide du MacSpeech Lab, systeme de traitement et d’analyse 
de I’onde sonore. 

Les differents mots de ces phrases ont alors fait I’objet de mesures 
temporelles pr6cises effectuees avec le MacSpeech Lab : duree de chaque 
phrase, de sa partie "Montrez le”, du silence du /k/ ou du pr^voisement du 
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/gA de leur VOT et de la voyelle nasale. Parmi les 10 exemplaires de 
chacun des deux types de phrases, celui qui a pr6sent6 les caract6ristiques 
temporelles les plus proches de la moyenne de sa s6rie a €l6 consid6r6 
comme le plus "prototypique" et a 6i6 retenu. Cette selection a done 
permis d’isoler les deux phrases "Montrez le camp" et "Montrez le gant" 
qui ont servi k construire le continuum. Ces phrases ont les 
caract6ristiques temporelles suivantes (entre parentheses figure, en msec, 
la valeur moyenne de la s6rie correspondante) : 



"Montrez le camp" 


"Montrez le" 


silence du A/ 


VOT 


voyelle 


943 


625 


123 


34 


161 


(957) 


(629) 


(128) 


(35) 


(165) 


"Montrez le gant" 


"Montrez le" 


pr6vois. du /g/ 


VOT 


voyelle 


976 


646 


94 


25 


211 


(958) 


(634) 


(93) 


(23) 


(208) 



B. La construction du continuum 

Trois regies ont 6te observ6es pour cette construction : 

- elaborer un continuum comportant 12 etapes; 

- obtenir des realisations claires et non ambigues de chacune des deux 
extremites du continuum : "camp" et "gant"; 

- respecter autant que possible les contraintes de production orale (en 
concevant des etapes intermediaires caracteris6es par des alterations 
acoustiques physiologiquement plausibles). Le passage par etapes de 
la non-voisee ("camp") a la voisee ("gant") a done du respecter cette 
contrainte. 

La procedure d’hybridation suivie a consiste d’abord a construire les 
deux extr6mit6s du continuum. Pour Textremite "camp", nous avons 
concatene "Montrez le" (jusqu’a la fin du "le") de "Montrez le gant" avec 
"camp" (precede des 123 msec du silence de son occlusive) de "Montrez le 
camp". Le "camp" concat6n6 a 6te allong6 de 23 msec afin que la 
longueur du /a/ se rapproche de celui du "gant" et que le mot puisse etre 
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per 9 u soit comme un "camp" soit comme un "gant" tout au long du 
continuum. Cet allongenient a 6t6 pratique en pr^levant la p6riode de plus 
grande intensity dans la partie stable de la voyelle, en la reproduisant six 
fois cons6cutivement et en la r6ins6rant dans son emplacement d’origine. 
Ni I’examen visuel de I’onde sonore, ni son 6coute, n’ont r6v616 
d'anomalie particuliere. Pour rextr6mit6 "gant", nous avons concat6n6 
"Montrez le" de "Montrez le gant" (en incluant les 94 msec du 
pr6voisement de I’occlusive /g/) avec "camp" (sans son silence). En 
consequence, le "gant" de cette extr6mite n’avait du "gant" d’origine que 
les indices port6s par les syllabes pr^c^dentes et par le prevoisement. 

En ce qui conceme les 10 items interm6diaires, nous sommes passes 
progressivement de Textr^mite "Montrez le camp" k I’autre extremite 
"Montrez le gant" en rempla 9 ant par Stapes le silence de "camp" par le 
prevoisement de "gant" tout en pr6servant la proportionnalite relative de 
leur dur6e (123 et 94 msec respectivement). Afin d’^viter toute rupture 
brutale dans le signal, la concatenation des segments avec pr6voisement a 
et6 pratiqu6e en d6coupant I’onde sonore a I'endroit ou la partie negative 
de la p6riode passe par zero. Le respect de cette contrainte est a I’origine 
des sauts legerement irreguliers que Ton peut observer dans les dif- 
f6rentes 6tapes du pr6voisement. Le tableau ci-dessous donne les valeurs 
de prevoisement et de silence (en msec) pour les douze items : 



Items 


Pr6voisement 


Silence 


1 


0 


123 


2 


9 


112 


3 


18 


101 


4 


27 


90 


5 


36 


78 


6 


45 


67 


7 


49 


56 


8 


59 


45 


9 


69 


34 


10 


79 


22 


11 


88 


11 


12 


94 


0 



ERIC 
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2. Evaluation pilote du continuum 

Afin de verifier que les deux extr^mites du continuum sont per9ues de 
fa9on non ambigue comme "camp" ou "gant" respectivement, qu’il existe 
bien une fronti^re perceptive a Tint^rieur du continuum, et que celle-ci 
est nette, nous avons conduit une experience d’identification pilote avec 
quatre sujets. Les douze phrases ont ete presentees quatre fois de fa9on 
aieatoire; les sujets ont indique s’ils entendaient "camp" ou "gant" et ont 
precise leur degre de certitude dans leurs reponses (sur une echelle de 1 ^ 
6 ). 



Le tableau ci-dessous presente les pourcentages de reponses "camp" 
pour les douze etapes : 





1 


2 


3 


4 


5 


6 


7 


8 


9 


10 


11 


12 


SI 


100 


100 


100 


100 


100 


25 


0 


0 


0 


0 


0 


0 


S2 


100 


100 


100 


100 


100 


100 


50 


0 


0 


0 


0 


0 


S3 


100 


100 


100 


25 


0 


0 


0 


0 


0 


0 


0 


0 


S4 


100 


100 


100 


0 


0 


0 


0 


0 


0 


0 


0 


0 



Ce tableau revele I’existence d’une frontiere nette pour chacun des 
sujets; en effet, le passage de la perception du "camp" au "gant" s’effectue 
sur un item au plus. En outre, comme on Tobserve generalement dans ce 
type de tache, I’emplacement des frontieres varie quelque peu de sujet a 
sujet. De surcroit, nous avons observe que les quatre sujets ont donne un 
degre de certitude maximale aux items des extremites. 
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Traitement du langage chez le bilingue : 
la comprehension des interferences 

Delphine Guillelmon 



Resume 



Le but de ce travail est d’^tudier le phenom^ne de I’interference et en 
particulier la fa 9 on dont elle est trait^e en temps r^el par le bilingue et le 
monolingue. Deux textes fran^ais contenant des interferences du suisse- 
allemand ainsi que les textes correspondants en fran^ais standard ont 
pr^sent^s h des sujets. Ceux-ci devaient d’une part comprendre les textes, 
pour pouvoir r6pondre par la suite h un questionnaire, et d’autre part appuyer 
aussi rapidement que possible sur une touche chaque fois qu’ils entendaient 
un signal sonore (place apres les interferences ou les items fran^ais 
correspondants). Les resultats du questionnaire de comprehension montrent 
que les monolingues ont plus de peine que les bilingues ^ comprendre des 
textes contenant des interferences et que les bilingues semblent h I’aise quel 
que soit le type de texte. L’analyse des temps de reaction, elle, ne donne pas 
de resultats significatifs : la tache experimentale utilisee ne semble done pas 
permettre retude des operations sous-jacentes k la comprehension des 
interferences. 

1. Introduction 

De nombreux chercheurs ont aborde le domaine du bilinguisme et de 
la personne bilingue. Le degre d'aisance dans chacune des langues a ete le 
critere principal pour certains comme Haugen (1969) et Macnamara 
(1967), alors que d’autres, dont Grosjean (1982), ont mis I'accent sur 
I'utilisation reguliere des deux langues. Nous retenons le point de vue de 
ces demiers et d6finissons le bilinguisme comme I'utilisation reguliere de 
deux (ou plusieurs) langues, et le bilingue comme une personne qui 
emploie regulierement deux langues ind6pendamment du degre de 
maitrise de celles-ci. 

Dans ses activites quotidiennes, le bilingue se deplace le long d'un 
continuum de communication (Grosjean, 1982). A Tun des bouts du 
continuum, le bilingue est dans une situation de communication 
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monolingue, c’est-^*dire qu'il aura affaire ^ des personnes monolingues 
ne connaissant pas, ou peu, I’autre langue. A I’autre extr6mit6, le bilingue 
se trouve dans une situation de communication bilingue, c’est-a-dire que 
ses interlocuteurs seront egalement des personnes bilingues maitrisant les 
memes langues que lui. Par convention, on se r6f^re aux deux extremites 
de ce continuum, mais de nombreuses situations intermddiaires existent. 
Quelle que soit la situation, meme monolingue, il est tres difficile, voire 
impossible, de desactiver compl^tement I’autre langue. 

En situation monolingue, cette non-desactivation se manifeste par les 
interferences y c'est-^-dire, selon Grosjean (1987) ''les influences involon- 
taires et/ou accidentelles d'une langue sur iautre". Les interferences 
peuvent apparaitre a tous les niveaux du langage (phonetique, 
phonologique, lexical, syntaxique, semantique et prosodique), dans Toral 
comme dans r6crit, comme par exemple : 

- au niveau phonologique, lorsque un locuteur suisse-allemand a un 
accent, on pourra I’entendre dire au sujet d’un bebe: "Quel choli 
pepe"\ 

- au niveau lexical, un mot ou une expression peuvent etre traduits 
dans I'autre langue et on pourra rencontrer une phrases comme : 
"Cest mieux d’aller aux toilettes ici plutot qu’au theatre, car ici il 
n’y a pas de serpent" (provenant de I’expression allemande "Vor dem Klo gibt 
es eine Schlange" signifiant qu'il y a une queue (serpent) devant les cabinets). 

En situation de communication bilingue, bien qu’ayant, la plupart du 
temps, une langue de base definie, les locuteurs auront recours a I’autre 
langue s’ils en ont besoin et si I’environnement psychologique le permet. 
11s ont alors deux possibilites : 

1) I’altemance codique (ou ’’code-switch") qui est le passage d’une 
langue a I’autre, en conservant les caracteristiques respectives de chaque 
langue dans les 6nonces. On entendra, par exemple : 

"Papa hat mir gesagt : Si tu ne te depeches pasje pars sans toi", 

2) I’emprunt qui est un mot ou une courte expression adapte 
phonologiquement et morphologiquement a la langue parlee. On 
rencontrera, par exemple : 

"Ich debrouilliere mich jetzt sehr gut in der Kiiche" (ou le verbe "se 
d^brouiller" a 6t6 adapte ^ I'allemand). 
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Si on regarde ce que la psycholinguistique offre comme travaux sur 
le bilingue, on voit qu’elle n’en est encore qu’a ses d6buts dans ce 
domaine. Ces trente demieres annees ont surtout et6 consacr6es a certains 
aspects qui paraissent actuellement moins importants tels que la discussion 
du lexique ou les distinctions entre bilinguisme coordonne, compos6 ou 
subordonn6. On a fait de la psycholinguistique "off-lirie", c’est-a-dire que 
Ton s’est principalement occup6 des operations qui ont lieu une fois le 
traitement imm6diat, en temps r6el, termin6 (Grosjean, 1982). 

On s’est beaucoup moins intdresse aux aspects tels que les mdcanismes 
sous-jacents a I’altemance codique, au traitement immddiat de 
I’information per 9 ue (exemples : identification des sons, reconnaissance 
des mots, etc.). Nous avons en fait tres peu d’informations sur I’utilisation 
en temps r6el du langage par le bilingue pendant les processus de 
production, de perception ou de construction de l’6nonc6. Quelques 
recherches ont 6t6 faites en situation de communication bilingue, mais 
aucune ne porte sur la comprehension des interferences. 

Nous tenterons, dans notre recherche, de mieux comprendre I’effet 
des interferences sur la perception et la comprehension chez les 
monolingues et chez le bilingues. De plus, nous essayerons d’obtenir des 
informations sur les operations sous-jacentes en utilisant une tache en 
temps reel. Trois questions sous-tendent I’etude : 

1) La comprehension d’un enonce est-elle affectee lorsque celui-ci 
contient des interferences ? 

2) Cela depend-il du type d'auditeur, monolingue ou bilingue ? 

3) L'etude du traitement en temps reel d’un enonce contenant des 
interferences peut-elle nous offrir un edairage sur les operations 
sous-jacentes chez les deux types d’auditeurs ? 

Pour repondre a la premiere question, nous presenterons a des sujets 
deux versions d’un meme texte fran^ais, I’une ne contenant aucune 
interference alors que I’autre sera parsemee d’interferences suisse- 
allemandes. 

Pour traiter la deuxieme question, nous presenterons les textes aussi 
bien a des personnes monolingues qu’i des personnes bilingues fran9ais / 
suisse-allemand et nous comparerons leurs resultats. 
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Pour r^soudre la troisieme question, nous introduirons dans les textes 
un signal sonore k divers endroits cruciaux du texte, c’est-a-dire apres les 
interferences dans les versions contenant des interferences ou apr^s les 
items fran 9 ais correspondants dans les versions sans interferences. Les 
sujets devront reperer aussi rapidement que possible les signaux sonores 
tout en cherchant a comprendre ce qu'ils entendent. Nous mesurerons 
leurs temps de reaction. Notre objectif est de chercher a montrer qu’il 
existe une relation entre la vitesse de reaction au signal sonore et la 
difficulte de comprehension du sujet k ce point-la du texte. Nous 
prevoyons que les auditeurs monolingues auront des difficuUes de 
comprehension lorsqu’ils entendront des interferences et qu’ils 
manifesteront done des temps de reaction plus longs aux signaux sonores, 
alors que les bilingues ne devraient pas etre ralentis par le traitement des 
interferences. Tous les details concemant cette etude (methode, analyse 
des resultats et discussion) pourront etre trouves dans Guillelmon (1991). 

2. Methode 

Sujets : 28 sujets volontaires, n’ayant pas de perte auditive ni de traitement medical 
ralentissant leurs reflexes, ont pris part h I'experience. Un questionnaire biographique et 
linguistique leur a 6t6 donne k remplir. Cela a permis de repartir les sujets en 2 groupes 
distincts. 1) 12 sujets monolingues, fran^ais, habitant Lyon, n’ayant aucune 
connaissance de I’allemand ni du suisse-allemand. 2) 16 sujets bilingues suisse-allemand 
/ fran^ais qui utilisent quotidiennement ces deux langues. 

Matiriaux : Divers types de mat^riaux ont €i€ 61 aborts : 

Les bandes sonores : II s’agit de textes enregistr6s sur une cassette audio que Ton 
fera entendre aux sujets. Nous avons proc6d6 en trois temps : (a) la preparation des 
textes, (b) I’enregistrement de ceux-ci, (c) I’insertion du signal sonore. 

(a) La preparation des textes : Nous avons construit deux textes d'environ cent 
mots, chacun contenant sept interferences reparties de fagon plus ou moins reguliere dans 
les textes. Nous avons choisi des interferences suisse-allemandes dont la forme frangaise 
est equivalente en longueur (p. ex. "roman criminel" pour "roman policier"). La majorite 
des interferences des deux textes porte sur des mots et des expressions idiomatiques, le 
reste sur la syntaxe. On obtient ainsi deux textes "avec interferences"(In) et deux textes 
"frangais" (Fr) leur correspondant. 

(b) L’enregistrement des textes : Nous avons demande ^ une personne bilingue 
suisse-allemand / frangais, parlant les deux langues sans accent, de lire ces quatre textes 
en frangais en prenant un accent. 

(c) L’insertion du signal sonore : Une fois les enregistrements effectu6s, nous les 
avons digitalises ^ 1‘aide du syst^me Mac Recorder. On ins6rait un signal sonore 
(frequence : 1000 Hertz, dur6e : 200 msec.) k la fin acoustique de chaque interference (ou 
du terme frangais correspondant). Ces textes, ainsi modifies, ont ensuite 6t6 transfer6s de 
I’ordinateur sur une cassette audio. 
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Les questionnaires de comprehension : Pour chacun des deux types de textes, nous 
avons etabli une liste de cinq questions, quatre questions factuelles et une question 
d 'inference. 

Le test de frequence : Nous avons constitue une liste de toutes les interferences 
apparaissant dans les textes. En face de chacune d'elles s'echelonnaient les chiffres de 1 k 
7, 1 signifiant "Jamais" et 7 "Tres souvent". II s’agissait, pour le sujet, d’estimer la 
frequence (sur I’echelle de 1 ^ 7) ^ laquelle les gens autour de lui produisent, dans leur 
vie quotidienne, ces interferences. 

Le questionnaire biographique : Ce questionnaire a ete constitue afin de s'assurer 
que tous les sujets appartenaient bien au groupe monolingue ou au groups bilingue. Outre 
I'age, la profession et les langues utilisees, on desirait egalement obtenir des indications 
sur les competences linguistiques de ces langues, surtout sur la comprehension, mais 
egalement sur la production orale, recriture et la lecture. 

Procedure : Le sujet commen 9 ait par remplir le questionnaire biographique. Puis on 
lui soumettait par ecrit les instructions quant h la suite de la proc^ure et on les lui 
reexpliquait oralement. On faisait alors entendre au sujet un texte. Tout en cherchant ^ 
comprendre ce texte qui lui etait soumis, sachant qu’on lui poserait des questions h. ce 
propos, le sujet devait repdrer les signaux sonores et appuyer sur un bouton d^s qu’il les 
percevait. A la fin de chaque texte, on pr^sentait au sujet les questions s’y rapportant. 

Apr^s avoir entendu une fois chacun des quatre textes (premiere presentation), on 
les repassait une deuxi^me fois dans le meme ordre (deuxi^me presentation) en 
demandant au sujet de reagir h nouveau aux signaux sonores et de tenter de comprendre 
encore mieux les textes afin de completer ses reponses. Puis, le sujet remplissait le test de 
frequence. 

Analyse des donnies : Les questionnaires de comprehension : Les reponses des 
sujets, pour pouvoireire iraitees statistiquement, ont du etre converties en nombres. Pour 
chaque sujet, nous avons reuni les yaleurs concemant les textes en fran 9 ais standard lors 
de la premiere presentation ou de la seconde presentation du texte et avons calcuie la 
moyenne. Nous avons procede de meme pour les textes avec interferences. Nous avons 
alors regroupe les moyennes obtenues par tous les sujets en tableaux et les avons 
soumises h, des analyses statistiques (un test t apparie et deux analyses de variance). 

Les temps de reaction : Les temps de reaction des sujets ont ete soumis ^ deux sortes 
d'analyses differentes. Lors de la premiere, nous avons procede au remplacement des 
valeurs extremes. Pour chaque sujet, nous avons procede au calcul des moyennes par 
type de texte (Fr ou In) et par presentation (1 ou 2). Puis nous avons calcuie les 
moyennes sur I'ensemble des sujets selon les types de textes et les presentations. Ces 
donnees ont alors ete regroupees et soumises h une analyse de variance. 

Lors de la deuxieme analyse, nous avons analyse les ecarts- types, c’est-k-dire la ten- 
dance de dispersion des temps de reaction. Nous avons calcuie, pour chaque sujet, 
recart-type portant sur les textes en fran 9 ais standard et celui portant sur les textes avec 
interferences. Nous avons regroupe ces valeurs en tableaux et avons procede h, une 
analyse de variance. 

Le test de frequence : Les valeurs obtenues lors de ce test pouvaient varier entre 1 et 
7 selon I'echelle d’evaluation qui avail ete proposee aux sujets. Nous avons reporte ces 
resultats sur une grille ou, pour chaque interference proposee, nous avons note les 
resultats de chaque sujet en fonction de son groupe d’appartenance (monolingue ou 
bilingue). Nous avons alors applique pour les valeurs de chaque interference, un test t 
non-apparie entre les resultats des monolingues et des bilingues. De plus, nous avons 
calcuie la moyenne globale des valeurs donnees aux interferences par les bilingues et. 
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avec un test t non-appari^, Tavons compar^e k la moyenne globale fournie par les 
monolingues. 

3. R^sultats et discussion 

Les resultats des questionnaires de comprehension 

Etant donne que les resultats aux questions etaient significativement 
diffdrentes lors de la premiere et la deuxi^me presentation (t = 11.08, 
p<0,001 et t = 7.97, p<0,001 pour chacun des deux textes), nous avons 
procede k deux analyses distinctes, selon qu'il s’agit de la premiere ou de 
la seconde presentation des textes. 

1) Premiere presentation des textes 

La Figure 1 montre la moyenne des resultats de comprehension 
obtenus lors de la premiere presentation des textes en fonction du type de 
texte et des sujets, bilingues ou monolingues. 




SANS INTERFERENCES AVEC INTERFERENCES 
TYPE DE TEXTE 







Figure 1 : Niveau moyen de comprehension des sujets bilingues et 
monolingues lors de la premiere presentation des deux types de textes - 
sans interferences et avec interferences 
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Pour les textes sans interferences, on observe que le niveau moyen de 
comprehension des bilingues, barre noire, est de 1,53 et celui des 
monolingues, barre grisee, de 1,57 (le maximum etant de 2). Quant aux 
textes avec interferences, barres de droite, on remarque que le niveau de 
comprehension moyen chez les bilingues est de 1,46 et celui des 
monolingues de 1,04. A premiere vue, les monolingues semblent 
comprendre les textes sans interferences aussi bien que les bilingues, mais 
avoir plus de peine avec les textes contenant des interferences. 

Une analyse de variance montre qu’un effet de texte existe, c'est-^- 
dire que les deux types de textes sont compris par les sujets de mani^re 
significativement diffdrente : 1,55 pour les textes sans interferences et 
1,28 pour ceux avec interfdrence (F(l,26) = 22,78, p<0,001). Bien qu'un 
effet de groupe n’existe pas (1,49 pour les bilingues et 1,30 pour les 
monolingues (F(l,26) = 3,50 NS)), nous trouvons une interaction 
(F(l,26) = 15,75, p<0,001). Cela signifie que le comportement des 
groupes est different selon la nature du texte. En effet, alors que les deux 
groupes obtiennent les memes r^sultats pour les textes en fran9ais 
standard d'apres le test post-hoc Tukey (1,53 et 1,57, NS), ils se 
distinguent de fa9on significative par leurs scores lors des textes avec 
interferences (1,46 et 1,04, p<0,001). On constate encore que les r6sultats 
du groupe bilingue pour les textes sans et avec interferences sont 
identiques statistiquement (1,53 et 1,46, NS), alors que ceux du groupe 
monolingue sont differents pour ces memes textes (1,57 et 1,04, 
p<0,001). Les monolingues ont done plus de peine avec les textes 
contenant des interferences. 

De cette analyse statistique, nous concluons que les bilingues et les 
monolingues comprennent les textes fran9ais de la meme maniere, mais 
que les monolingues ont beaucoup plus de mal avec les textes qui 
contiennent des interferences. 

2) Deuxieme presentation des textes 

Sur la Figure 2, a la page suivante, nous presentons la moyenne des 
resultats de comprehension obtenus lors de la seconde presentation des 
textes en fonction du type de texte et des groupes de sujets, bilingues ou 
monolingues. 
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SANS INTERFERENCES AVEC INTERFERENCES 
TYPE DE TEXTE 



Figure 2 : Niveau moyen de compr6hension des sujets bilingues et 
monolingues lors de la deuxieme pr6sentarion des deux types de textes 
- sans interferences et avec interferences 



En observant cette figure, on remarque qu'elle ressemble beaucoup a 
la figure pr6c6dente, si ce n'est que routes les valeurs sont augmentees. 
Comme on pouvait s’y attendre, une deuxieme ecoute produit done une 
amelioration de la comprehension des sujets. On remarque que le niveau 
moyen de comprehension pour les textes sans interferences des bilingues, 
barre noire, est de 1,88 et celui des monolingues, barre grisee, de 1,84 (le 
maximum etant de 2). Quant aux textes avec interferences (barres de 
droite), le niveau de comprehension moyen chez les bilingues est de 1,92 
et celui des monolingues de 1,42. En regardant le graphique, il semble 
que les monolingues comprennent les textes sans interferences aussi bien 
que les bilingues, mais qu’ils continuent a avoir plus de peine a 
comprendre les textes avec interferences que les bilingues. Par contre, les 
bilingues semblent a Taise quel que soit le type de texte. 

Une analyse de variance nous permet de verifier ces constatations. 
Elle montre qu'un effet de texte existe, puisque les deux types de textes 
sont compris par les sujets de maniere significativement differente : 1,86 
pour les textes sans interferences et 1,70 pour les textes avec (F(l,26) = 
26,36, p<0,00l). Nous obtenons cette fois-ci aussi un effet de groupe. 
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dans la mesure ou la comprehension de I’ensemble des textes par les 
bilingues et les monolingues differe significativement : 1,89 pour les 
bilingues et 1,63 pour les monolingues (F(l,26) = 19,67, p<0,001). 

L’interaction est k nouveau significative (F(l,26) = 57,45, p<0,001) 
et montre que le comportement des groupes est different selon la nature 
du texte. En effet, en employant le test post-hoc Tukey, on constate que 
les deux groupes obtiennent les memes resultats pour les textes en fran 9 ais 
standard (1,88 et 1,84, NS), alors qu*ils se distinguent de fa 9 on 
significative lors des textes avec interferences (1,92 et 1,42, p<0,(X)l). On 
constate aussi que les resultats du groupe bilingue pour les textes sans et 
avec interferences sont identiques statistiquement (1,92 et 1,88, NS), alors 
que ceux du groupe monolingue sont diff6rents pour ces memes textes 
(1,84 et 1,42, p<0,001). Les bilingues n'ont done pas de problemes de 
compr6hension quel que soit le type de texte, alors que les monolingues 
ont plus de peine avec les textes qui contiennent des interferences. De 
cette analyse statistique, nous concluons que, lors de la seconde pr6senta- 
tion, les textes avec interf6rences sont a nouveau moins bien compris par 
les monolingues que par les bilingues. Le fait d’6couter ces textes une 
deuxieme fois am61iore certes la comprehension des sujets monolingues, 
mais pas au point d’atteindre le niveau des textes sans interferences. Une 
fois encore, le monolingue butte sur des expressions qui ne lui sont pas 
familieres et auxquelles il ne parvient pas entierement a donner du sens, 
car la langue dont les interferences proviennent lui est inconnue. La 
comprehension du texte ne peut done etre aussi bonne que celle d’un texte 
ne contenant pas d’interf6rences. Le bilingue, par contre, parvient a 
identifier ais6ment le sens des divers textes et n'est pas gene par les 
interfdrences, puisqu’il connait les deux langues qui constituent les 
enonces. 

Les resultats de la mesure des temps de reaction 

Par un test t appari6 que nous avons appliqu6 d’une part aux textes 
avec interferences et d’autre part aux textes en fran 9 ais standard, nous 
avons constate qu’il n’existe pas de difference significative entre la 
premiere et la seconde presentation. Nous avons alors regroupe 
I’ensemble des donnees. Une analyse de variance indique qu’il n’existe 
aucun resultat significatif, mais seulement une tendance des bilingues a 
reagir plus rapidement que les monolingues. 

4 7 ^ 
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Suite h cette analyse, nous avons d6cid6 de nous int^resser aux valeurs 
extremes des temps de reaction dont nous n'avions pas tenu compte. Cette 
analyse montre que la variabilite des temps de reaction depend du groupe 
d’appartenance du sujet. Globalement, les monolingues ont une plus 
grande variabilite que les bilingues; cela est du surtout aux textes avec 
interferences, mais cette difference n'est pas tout a fait significative. Une 
explication possible semble etre que les sujets sont pris de court par 
certaines interferences, ce qui retarde leur temps de reaction et provoque 
ainsi des valeurs tres elevees. 

Les resultats du test de frequence 

Pour chaque interference, nous avons calcule la valeur moyenne 
(pouvant varier entre 1 et 7) donnee par les sujets monolingues et les 
sujets bilingues, puis nous avons applique un test t non apparie. Sur les 
quatorze interferences presentees, six d'entre elles ont des differences 
significatives alors que les autres n'en ont pas, certaines etant presque 
significatives. Les bilingues ont done Timpression, pour certaines 
interferences, de les avoir entendu significativement plus souvent que les 
monolingues. 

Nous avons ensuite calcule les moyennes des valeurs indiquees par 
chaque sujet, bilingue ou monolingue, pour toutes les interferences 
proposees. Enfin, nous avons de nouveau applique un test t non-apparie 
entre les bilingues et les monolingues. Le test etait significatif (t = 3,25, 
p<0,01). De fa 90 n generate, les bilingues ont done I'impression d'avoir 
entendu significativement plus souvent les interferences qui leur etaient 
proposees que les monolingues. 

Nous en concluons que pour les bilingues ces interferences semblent 
generalement plus frequentes que pour les monolingues. Lorsqu'on leur 
presente une interference, ils ont probablement acces a leurs systemes 
internes (lexiques, syntaxes) qui confirment qu’elle peut exister, ce qui les 
amene a penser qu’ils Tont peut-etre deja entendue. Malgre tout, ces 
expressions ne sont pas considerees comme tres frequentes. 
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4. Discussion g^n^rale 

A I’aide des divers r^sultats analyses et discutes dans la partie 
prec^dente, nous aliens essayer de r^pondre aux trois questions qui sous- 
tendaient I'ensemble de notre 6 tude. Nous aliens traiter les deux 
premieres questions de fa9on simultan^e, car dies sont li^es. L'analyse du 
questionnaire de comprehension nous a donne des informations utiles 
concemant les types d'auditeurs ainsi que I’influence d'interferences sur 
la comprehension. Ainsi, nous pouvons affirmer que la presence 
d'interferences dans un enonce peut effectivement affecter la comprehen- 
sion de celui-ci. Cest le cas lorsque Tauditeur est une personne 
monolingue. Cela est certainement du au fait que le monolingue ne 
connait pas la langue de provenance des interferences. Sa propre langue 
ne lui permet pas completement de compenser ce manque, et I’enonce 
avec interferences est alors moins bien compris que celui qui n'en 
contient pas. 

Par contre, le bilingue, dans une situation de communication bilingue, 
n’a aucun probleme de comprehension des enonces avec interferences. 
Une analyse statistique montre d'ailleurs que sa comprehension est 
equivalente pour des enonces avec ou sans interferences. Meme s'il 
semble normal que le bilingue comprenne ces deux types d'enonces, il 
ressort de notre etude que le bilingue parvient parfaitement a utiliser ses 
deux langues pour traiter un enonce dans lequel il trouve des expressions 
des deux langues. Il ne semble pas gene par la cohabitation de ses deux 
langues, et il peut meme les employer pour comprendre des enonces 
auxquels des monolingues ont de la peine a acceder. De plus, le bilingue 
comprend aussi bien que le monolingue des enonces qui sont constitues 
uniquement d'eiements provenant d'une seule langue. 

Pour repondre k la troisieme question, nous avons demande aux sujets 
de reagir h la perception d'un signal sonore lors de I'ecoute de textes. 
Nous avons constate que les temps de reaction des sujets ne se rhodifient 
pas, quel que soit le type de texte presente. Mais, parallelement, le niveau 
de comprehension chez les monolingues est affecte par les textes 
contenant des interferences. Ces considerations nous amenent a supposer 
que la mesure utilisee en temps reel, soit la reaction a un signal sonore, 
porte sur une tache qui peut se faire de fa9on assez independante de la 
tache de perception et de comprehension linguistique. Reagir h un signal 
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sonore de 200 msec et de 1000 Hz n’est pas affect^ par ce qui se passe en 
comprehension, les temps de reaction etant tous identiques. La 
permeability entre le canal de traitement linguistique et celui de 
perception du signal sonore demeure solide. II semblerait done qu'il soit 
possible d’avoir deux activites en meme temps, pour autant qu’elles 
n'utilisent pas les memes canaux d’acces, ce qui etait le cas dans notre 
etude. La tache en temps reel que nous avons proposee aux sujets ne 
permet done pas d’etudier les operations sous-jacentes a la 
comprehension. De nombreuses autres etudes seront encore necessaires 
pour parvenir h les determiner. 
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L'influence de la langue de base dans la perception des alternances 
codiques : le cas de la consonne initiale du mot 

Kathrin Handschin 



R^sum^ 



L'objectif de ce travail est d’^tudier l’influence de la langue de base sur 
la perception des alternances codiques en parler bilingue. Nous avons 
construit un continuum acoustique de 18 ^l^ments dont. les extr^mit^s 
^taient "th6” fran 9 ais et "Tee" allemand. Ces stimuli ont ensuite ^t^ 
pr^sent^s soil ^ la fin d’une phrase fran 9 aise soil h la fin d’une phrase 
allemande ^quivalente. La tache des sujets, bilingues suisse- 
allemand/fran 9 ais, 6tait d’identifier le dernier mot de chaque phrase. Les 
r^sultats ont montr^ que la langue de base peut produire soit un effet de 
contraste, soit un effet d’assimilation, soit aucun effet. Nous terminons en 
proposant une explication de ces diff^rents r^sultats. 

1. Introduction 

Lorsque les bilingues discutent entre eux, leur parler est souvent 
caracterise par des changements de langue momentan6s que Ton designe 
sous le terme d*alternances codiques. Bien qu'etudi6s de mani^re 
approfondie au niveau linguistique et sociolinguistique, ces 616ments et 
leur traitement ont fait I’objet de peu de recherche dans le domaine de la 
psycholinguistique. 

L’6tude qui a inspire en premier ce travail est celle de Grosjean & 
Soares (1986). Les auteurs y ont examine l'influence qu'exercent deux 
facteurs sur I'identification de la langue des alternances codiques : la 
sp6cificite des phonemes que contient cette altemance et l'influence de la 
langue de base. Ils ont trouv6 que la langue de base peut influencer de 
maniere oppos6e la perception de ces alternances : elle peut soit les 
assimiler (les Elements sont alors catdgoris6s comme appartenant ^ la 
langue de base) soit les repousser (sous I'effet du contraste cr66 par la 
langue de base, les alternances sont per 9 ues comme appartenant a I'autre 
langue). 
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Afin de mieux comprendre ces effets, nous avons decide d'utiliser une 
approche bien connue en perception de la parole, k savoir I’identification 
d’61ements issus d’un continuum acoustique. Nous voulions savoir si la 
langue de base a une influence sur la perception de sujets bilingues lorsque 
ceux-ci entendent des stimuli en provenance d’un continuum qui chevauche 
deux langues et qui contient done de nombreux Elements ambigus. Nous 
nous sommes pose les deux questions suivantes : 

- Est-ce que la perception d’un Element ambigu est influencee par la 
langue de base ? 

- S’il y a une influence, se reflete-t-elle par un effet de contraste ou un 
effet d’assimilation ? 

Nous avons pris pour modele I'etude de Biirki-Cohen, Grosjean & 
Miller (1989) qui se sont bas6s, en partie au moins, sur I’experience de 
Liberman & al. (1957), la premiere k montrer que la perception de la parole 
est caract6ris6e par un ph6nomene qui sera appel6 plus tard ’’perception 
categorielle” (voir les articles de Klose et Lambert-Dutoit dans ce meme 
num6ro). Biirki-Cohen & al. (1989) ont d’abord verifi6 que Ton pouvait 
reproduire le phenomene de perception categorielle lorsqu'on se servait 
d’un continuum inter-langues et non intra-langue. Ensuite, ils ont etudie 
I’effet de la langue de base sur cette categorisation et ont pu montrer qu'elle 
peut influencer la perception d’une altemance codique. En effet, ils ont 
trouve un effet de contraste pour les elements du continuum ”re-ray” 
(comme I'avaient suggere Grosjean & Soares (1986) quelques annees 
auparavant) mais aucun effet pour ceux tires du continuum ”de-day”. 

II existe, en fait, trois influences possibles de la langue de base sur les 
elements ambigus d’un continuum : 

1. La langue de base sert de contraste. Les sujets identifient davantage 
d’el6ments ambigus comme etant des alternances codiques. Ainsi, dans le 
cadre d’un continuum allemand-fran 9 ais, les stimuli ambigus seront per 9 us 
comme etant allemand dans un contexte fran 9 ais et comme 6tant fran 9 ais 
dans un contexte allemand. 

2. La langue de base assimile les elements ambigus. Les sujets 
identifient les elements ambigus comme appartenant k la langue de base. 
Dans un contexte fran 9 ais, ces elements seront identifies comme etant 
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fran^ais et dans un contexte allemand, ils seront per 9 us cbmme etant 
allemand. 

3. La langue de base n’exerce aucune influence sur la perception des 
elements ambigus; Les sujets les identifient dans les deux contextes de la 
meme fagon. 

Dans cette 6tude, nous avons voulu examiner quelle influence, parmi 
ces trois, affecterait le plus les elements d’un nouveau continuum inter- 
langues. Pour atteindre ce but, nous avons construit un continuum fran 9 ais- 
allemand (“the-Tee") que nous avons present^ a des sujets bilingues 
allemand/fran 9 ais. Nous esperions decouvrir un effet d’assimilation - la 
seule influence absente des resultats de I’etude de Burki-Cohen & al. 
(1989) - mais 6tions prets egalement a trouver les deux autres effets 
mentionnes ci-dessus. 

2. M^thode 

Sujets : Vingt-deux bilingues (allemand/fran 9 ais) ont pass^ I'exp^rience. Chaque 
sujet se servait r^guli^rement de ses deux langues dans la vie de tous les jours. Ses 
competences langagieres repondaient pleinement aux exigences communicatives de son 
environnement qui, selon la situation, n^cessitait I'utilisation de I'une, de I'autre ou des 
deux langues h la fois. Puisque les sujets n'^taient pas forc^ment des bilingues 
equilibr^s, nous avons tache de choisir des personnes dont la langue dominante etait 
I'allemand et d’autres dont la langue dominante etait le fran 9 ais. Lage des sujets etait 
variable, de meme que leur profession. 

Matiriaux : Dans le but de d^vier aussi peu que possible de Texp^rience de Burki- 
Cohen & al.. (1989) nous avons choisi la paire de mots ”th^” (fran 9 ais) et "Tee" 
(allemand). Ils se diff^rencient sur au moins trois variables : 

/) Le degri de VOT ("voice onset time") : La consonne "t" du mot allemand est plus 
forte, plus aspir^e et plus longue que celle du mot fran 9 ais. Sa longueur est mesur^e par 
le VC)T, h savoir, le d^lai entre la fin du silence d'occlusion et le dibut du voisement. 

ii) La longueur de la voyelle : La voyelle du mot allemand est plus longue que celle 
du mot ffan 9 ais. 

Hi) ^accentuation de la voyelle : La voyelle allemande est accentu^e, celle du 
fran9ais Test moins. Cela est du, au moins partiellement; au fait que la prosodie n'est 
pas la meme dans les deux iangues: 

Les deux phrases que nous avons retenues pour servir de contexte aux mots sont 
les suivantes : "Nachher mochten wir einen Tee" et "Aprfes nous aimerions un th6". 
Elies offrent les caract^ristiques suivantes : a) elles ont une signification identique ; b) 
elles sont assez longues afin de permettre au contexte d’avoir un effet; c) elles 
component le meme nombre de syllabes en allemand et en fran 9 ais ; d) les mots stimuli 
("th^" et "Tee") occupent la meme position dans les deux phrases. 
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Ces phrases ont lues et enregistr^es en studio, chacune h dix reprises, par six 
voix diff^rentes. Elies ont ensuite ^t^ ^chantillonndes h lOkHz et digitalis^es h. I'aide du 
MacSpeech Lab, syst^me de traitement acoustique de I'onde sonore. Le lecteur qui a 
prononc^ le mieux les phrases dans les deux langues a ^t^ retenu et ses productions ont 
^t^ mesur^es. Pour chaque groupe de dix phrases, celle qui pr^sentait les 
caract^ristiques temporelles les plus proches de la moyenne du groupe a ^t^ retenue. 
Cette selection a done permis d’isoler les deux phrases "Nachher mdehten wir einen 
Tee" et " Apr^s nous aimerions un th^" qui ont servi dans la suite de I'exp^rience. 

Trois regies ont ^t^ observ^es lors de la construction du continuum : 

- ^laborer un continuum comportant un nombre d'^tapes suffisamment grand afin 
de pouvoir observer un ^ventuel glissement de la fronti^re cat^gorielle ; 

‘ obtenir des realisations claires et non ambigues de chacune des deux extr^mit^s 
du continuum : "the" et "Tee"; 

- respecter autant que possible les contraintes de production orale (en concevant 
des etapes intermediaires caracterisees par des alterations acoustiques 
physiologiquement plausibles). 

Le premier element du continuum, I'eiement 0, est tout simplement le mot fran 9 ais 
"the" extrait de la phrase fran^aise. Les autres elements sont des hybrides obtenus en 
rempla^ant, par segments de longueur croissante, le debut du mot "the" par le debut du 
mot "Tee" (le reste de I'eiement provenant du mot fran^ais). A chaque etape, 5 msec de 
"the" etaient remplacees par 10msec de "Tee", et ce afln de respecter la longueur 
intrinsequement differente des deux mots. Afin d'eviter toute rupture brutale dans le 
signal, la concatenation des segments a ete pratiquee en coupant I'onde sonore k 
I'endroit ou la periode passe par zero. 

Nous avons procede de la sorte jusqu'^ I'eiement 13. Pour les trois elements 
suivants (14-17), nous n'avons plus pu oter des segments du fran^ais car nous etions 
arrives k un point ou la voyelle fran^aise commen^ait k perdre de 1' amplitude. Ajouter 
un "ee" plutot fort ^ un "e" trop faible aurait provoque une rupture perceptive 
artificielle. C'est pourquoi nous n'avons plus diminue la partie fran 9 aise et avons 
simplement continue k ajouter 5msec d'allemand. Le dernier element (le ISeme) 
comporte 51% d'allemand ce qui suffit pour qu'il soit per 9 u comme etant totalement 
allemand. 

Une fois les 18 elements du continuum prepares, nous les avons reinseres dans les 
deux phrases contextuelles. Les deux series de 18 phrases ainsi constituees - une pour 
I'allemand, 1 'autre pour le fran 9 ais - ont ensuite ete enregistrees sur bande magnetique, 
et ce dix fois en tout. Les phrases etaient presentees dans un ordre aieatoire k I'interieur 
de chaque serie. 

Procidure : Nous avons presente les deux series de phrases experimen tales k nos 
sujets bilingues. Chaque sujet a assiste k deux seances, une pour chaque langue. Entre 
les seances, il y avait une pause d'environ une semaine. Les instructions etaient donnees 
oralement dans la langue que nous utilisions normalement dans nos conversations avec 
les sujets pour que la situation soit aussi naturelle que possible. 

Pour chaque phrase, les sujets avaient k indiquer s'ils entendaient "the" ou "Tee" et, 
de plus, devaient donner un degre de confiance (echelle de 1 ^ 6, ou 1 correspond k un 
"Tee" clairement allemand et 6 ^ un "the" clairement fran 9 ais). 
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Analyse des donndes : Pour chaque sujet, nous avons iracd le pourcentage de 
r^ponses "thd" fran 9 ais en fonction de la quantity d'allemand dans le mot et cela pour 
les deux conditions contextuelles : allemande et fran 9 aise. Un examen attentif de 
chaque courbe nous a oblige ^ dliminer 6 sujets qui, pour des raisons diverses (non 
comprehension de la tache, absence de perception categorielle, etc.), n'ont pu presenter 
des donn^es analy sables. Deux mesures ont 6i6 retenues pour chacun des 16 sujets 
restants : 

1. Le pourcentage de r^ponses "the" fran 9 ais pour chaque element du continuum. 

2. L'emplacement de la frontiere perceptive. Celle-ci a ete calcuiee de la maniere 
suivante. Nous avons d'abord choisi les points h utiliser dans le calcul de la frontiere, h. 
savoir, le dernier point avant la chute de la courbe, les points faisant partie de cette 
chute et le premier point de I’etat stable apres la chute. Nous avons ensuite calcuie la 
droite de regression de Y (pourcentage d'identification de "the" fran 9 ais) en X (quantite 
d'allemand dans I'eiement) pour ces points. Ensuite, en nous basant sur I'equation de 
regression, nous avons calcuie la valeur de X' lorsque Y etait 50%. Cela nous a donne 
l'emplacement de la frontiere perceptive (en msec). Deux valeurs ont ete obtenues pour 
chaque sujet : I'un pour le contexte allemand et I’auire pour le contexte fran 9 ais. 

3. Resultats 

L'emplacement de la frontiere perceptive est similaire pour les deux 
contextes : 85 msec en contexte allemand et 88 msec en contexte fran 9 ais 
(difference non significative). A premiere vue, done, nous obtenons avec le 
continuum fran 9 ais-allemand "the-Tee" le meme type de resultat que 
Biirki-Cohen & al. avec le continuum fran 9 ais-anglais "d6-day", ^ savoir, 
aucun effet de la langue de base sur la perception des Elements ambigus du 
continuum. Cependant, un examen attentif des courbes individuelles nous a 
permis de decouvrir trois categories de sujets : ceux qui ne montrent aucun 
effet, ceux qui montrent un effet de contraste et ceux qui' montrent un effet 
d'assimilation. Ce sont ces resultats individuels que nous analysons ci- 
dessous. 

1. Groupe "Pas d’effet" : Dans ce groupe de neuf sujets, les frontieres 
dans les deux contextes ne sont jamais separ6es par +/~ 10 msec. 

2. Groupe "Effet contraste" : Quatre sujets obtiennent des differences 
de - 10 msec ou davantage entre la frontiere du contexte allemand et celle 
du contexte fran 9 ais (les courbes de I’allemand sont done h. droite des 
courbes du fran 9 ais). 

3. Groupe "Effet assimilation" : Trois sujets montrent une difference de 
+10 msec ou davantage entre la frontiere du contexte allemand et celle du 
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contexte fran^ais (la frontiere de Tallemand etant k gauche de la frontiere 
du franfais). 

La Figure 1 (page suivante) nous montre les r6sultats de ces trois 
groupes. Chaque graphe represente le pourcentage de reponses "the” 
fran 9 ais en fonction de la quantite d’allemand dans le mot. Les carres 
representent le contexte allemand et les cercles le contexte fran 9 ais. Pour le 
groupe ”Pas d’effet" (graphe du haut), nous voyons bien le chevauchement 
des deux courbes et I’emplacement identique de la frontiere perceptive. 
Pour le groupe “Effet contraste" (graphe du milieu), la courbe qui 
represente la perception en contexte allemand est clairement a droite de 
celle qui reflete la perception en contexte fran 9 ais. Enfin, pour le groupe 
’’Assimilation” (graphe du bas), la courbe du contexte allemand est cette 
fois-ci a gauche de celle du contexte fran 9 ais, montrant ainsi un effet 
d’assimilation. 

Comment expliquer ces trois types de resultats ? 

Groupe ”Pas d’effet” : Deux raisons peuvent rendre compte du manque 
d’effet de la langue de base sur la perception des elements ambigus. 

1. Les sujets ne prennent en consideration que l'61ement en question et 
non le contexte qui le precede ; il ne peut done pas y avoir un effet de 
contexte. Cette explication est d’autant plus plausible que nous avons 
affirme aux sujets que ce n’etait que le mot ”the/Tee” qui changeait. Ils 
n’avaient done plus lieu de se concentrer sur I'ensemble de la phrase. 

2. II se pourrait qu’il existe un effet de contraste dans un des contextes 
et un effet d’assimilation dans I’autre. Une telle repartition des effets ne se 
refleterait pas par un mouvement visuel des frontieres. Puisque ce sera 
toujours la meme langue a laquelle seront attribues plus d’elements, la 
frontiere perceptive se situera automatiquement les deux fois au meme 
endroit. 

Groupe ’’Contraste” : Les sujets qui font partie de ce groupe Jugent le 
mot toujours par rapport au contexte. Une toute petite difference de 
I’element ambigu est ’’grossie” par cette comparaison, et il est categorise 
comme appartenant a I’autre langue. Par consequent, les sujets de ce groupe 
mettent I’accent sur la difference entre le contexte et I’element. 




56 



CiRQUPE TAS D-EFFFT fn = 9 ) 



K, Handschin 57 




GRQUPE "EFFET CQNTRASTE" 




nRQlJPR -ASSIMILATION" fn o 3^ 




er|c 



nciJRE 1. LES COURSES D'IDENTIFICATION DES TROIS 
CROUPES DE SUJETS 



BEST COPY AVAILABLE 5 7 



58 Perception des alternances codiques 



Groupe ’’Assimilation" : Pour les sujets de ce groupe, le contexte sert a 
activer une langue donnee ; tout element qui peut en faire partie est integr€, 
meme s’il est ambigu. 

4. Discussion g^n^rale 

Les resultats de notre experience montrent que la langue de base peut 
exercer une influence sur la perception d’une altemance codique. Comme 
Biirki-Cohen & al. (1989), nous avons trouve a la fois un effet de contraste 
et I’absence d’un effet, mais contrairement k leur 6tude, nous avons aussi pu 
montrer un effet d’assimilation. Afin de mieux comprendre ces resultats, 
d’autres 6tudes avec d’autres continuums et d’autres paires de langues 
devront tenter d’isoler les variables qui expliqueraient ces effets. Parmi 
celles-ci nous trouvons : 

1. Des variables phonetiques 

Les stimuli seraient eux-memes la cause des effets differents. Certaines 
caracteristiques meneraient a un effet de contraste, d’autres a un effet 
d’assimilation et d’autres encore a aucun effet. Les resultats obtenus par un 
sujet dependraient alors des caracteristiques auxquelles celui-ci serait 
sensible lors de sa passatidn. 

2. Des variables psycholinguistiques 

Le type de bilinguisme des sujets pourrait expliquer, en partie tout au 
moins, les resultats obtenus. En effet, nous avons fait passer des sujets tres 
differents. II faudrait considerer leur age, I’age auquel ils ont appris leurs 
langues, la fa 9 on dont ils les ont apprises, I’environnement dans lequel ils 
les utilisent, etc. II se pourrait que ce soient des facteurs de ce type qui 
soient a I’origine des diffdrents effets. 

Une autre possibilite proviendrait de la (ou des) stratdgie(s) utilisee(s) 
par les sujets dans la tache d’identifi cation. II se pourrait qu’il y ait des 
"sujets contrasteurs" et des ’’sujets assimilateurs". Les "sujets contrasteurs" 
traiteraient I'onde acoustique de maniere ascendante. Ils feraient done (de 
fa 9 on schdmatique) d’abord et surtout une analyse phondtique. Ce procede 
favoriserait la perception des mots isoles et permettrait au sujet de bien 
entendre tous les traits "etrangers” a la langue de base. Ainsi naitrait I'effet 
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de contraste. Les ’’sujets assimilateurs", quant k eux, traiteraient I’onde 
acoustique de maniere descendante. Ils traiteraient d’abord I’^nonce en 
entier pour arriver ensuite a Tel^ment modifi^. Si les caracteristiques de la 
langue de Taltemance codique ne sont pas trop "marquees", ces sujets les 
oublieraient tout de suite et traiteraient T^l^ment comme 6tant un mot de la 
langue de base, d’ou un effet d'assimilation. Afin d obtenir la confirmation 
de ces suppositions, il faudrait determiner s’il est possible d’obtenir les 
deux effets chez le meme sujet (en faisant I’exp^rience deux fois avec le 
meme sujet mais en lui dormant des consignes differentes). Comme on le 
voit, le chemin est trace pour ceux qui d^sirent en savoir plus sur I’effet de 
la langue de base dans la perception d’elements ambigus. 
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L^acc^s au lexique de code-switchs chez le bilingue : 
effets de la density et du contexte ^ 

Markus Leuenberger 



R6sum^ 



L'61aboration de modules de reconnaissance de mots (acc^s au lexique) 
chez les bilingues a pris une certaine importance ces derni^res ann6es. 
Grosjean (1988), par exemple, a propose un module d’activation interactive 
pourrendre compte de I'acc^s au lexique en mode de communication bilingue. 
L’objectif de la pr6sente 6tude est de permettre d’affiner ce module par rapport 
aux effets contextuels. Nous avons fait varier la contrainte s6mantique et la 
density des code-switchs lors de la reconnaissance de code-switchs dans une 
tache de gating appliqu6e ^ des sujets bilingues suisse-allemand - firan 9 ais. Les 
r6sultats significatifs obtenus pour les deux variables test^es semblent montrer 
que la presence d’un code- switch pr6c6dent agit probablement comme 
information ascendante en augmentant le niveau d’activation de la langue la 
moins utilis6e tandis que la contrainte s6mantique active de mani^re 
descendante les mots de cette langue. 

1. Introduction 

Lors de la reconnaissance de mots, I'auditeur est confront^ h. deux 
taches simultan6es : d'une part, il doit analyser I’onde acoustique pour en 
extraire les unites linguistiques (phonemes, syllabes) et d'autre part, a 
Taide de ces unites, il doit identifier les mots 6nonc6s. Reconnaitre un mot 
n'est pas simplement une projection des caract6ristiques acoustiques et 
phon6tiques dans le lexique mental. C'est un processus compliqu6 qui 
comprend diverses 6tapes d'activation et d'inhibition, de correction, 
d'anticipation, etc. La recherche qui touche h, la reconnaissance des mots 
se periche k la fdis sur les effets qiii rerideht compte de I'acces aii lexique 
et sur les modeles qui r6unissent les effets en un tout coherent. 



^ Cette 6tude a pu etre entreprise et men6e h. bien grace k un subside du FNRS 
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Ce n’est que r6cemment que les chercheurs se sont toum6s vers la 
reconnaissance de mots chez le bilingue. La reality du bilingue est 
diff6rente de celle du monolingue dans la mesure ou le bilingue, dans sa 
vie de tous les jours, se trouve dans divers modes de communication. En 
effet, il peut passer d’un mode compl^tement monolingue ^ un mode 
bilingue. Dans le mode monolingue, le bilingue s’approprie la langue de 
I’interlocuteur monolingue et d6sactive, au mieux, son autre langue. Dans 
le mode bilingue, les interlocuteurs choisissent une des langues pour 
communiquer ensemble (c’est ce qu’on appelle la langue de base). 
Ensuite, tout en se servant de cette langue, ils peuvent introduire des 
616ments de I’autre langue (appel6e 6galement langue alternative). Une des 
possibilit6s est d’utiliser un code-switch, c’est-^-dire un mot, un syntagme 
ou une phrase de I’autre langue. 

Bien que la plupart des modeles monolingues de reconnaissance 
pourraient etre modifies pour tenir compte de la r6alite du discours 
bilingue, le type de modele qui est pour I'instant le plus prometteur est 
celui de I’activation interactive. Grosjean (1988) propose un modele de ce 
genre pour I’acc^s au lexique au niveau oral, modele base en partie sur 
TRACE de McClelland et Elman (1986). Selon Grosjean, quand un 
bilingue se trouve dans le mode bilingue, les deux langues sont activees, 
mais la langue de base Test davantage. L’activation d’une unite 
linguistique (phoneme, syllabe, mot, etc.) dans une des langues et de 
l’unit6 correspondante dans I’autre (si elle existe) depend de leur degre de 
similitude. L'activation des unites sp6cifiques une langue augmente 
I’activation globale de cette langue et accelere done la reconnaissance des 
mots de celle-ci. Par contre, l’activation d’unit6s linguistiques similaires 
dans les deux langues ralentit I’identification des unites de I'autre langue 
et, par consequent, les mots qui en font partie. Enfin, la frequence des 
homophones inter-langues (avec leurs seuils d’activation differents) et la 
configuration phonetique des mots (prononces comme code-switchs ou 
comme emprunts) influencent le processus de reconnaissance des mots de 
I’autre langue en accelerant ou en freinant leur acces. 

Grosjean a propose que dans le mode bilingue le niveau d'activation 
de I'autre langue est augmente ou abaisse selon le nombre de code-switchs 
ou d'emprunts produits pendant I’interaction. Cette proposition demeure 
mal definie cependant. La reconnaissance d’un code-switch se fait-elle 
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plus rapidement si celui-ci est pr6c6d6 par d’autres code-switchs, ou 
I’effet de la langue de base est-il tellement fort que le niveau d’activation 
de la langue alternative reste toujours tits has ? Le modele ne precise pas 
non plus le role de la contrainte s6mantique dans la reconnaissance des 
code-switchs. Celle-ci influence-t-elle leur acc&s ou non ? Ce sont ces 
deux questions qui ont 6te h la base de notre recherche. 

Dans cette etude, nous avons manipule deux variables contextuelles : 
la force de la contrainte s6mantique et la densite des code-switchs. Nous 
avons d6termin6 I’apport de chacune d’elles lors de la reconnaissance de 
code-switchs et avons tente de decouvrir s’il existe une 6ventuelle 
interaction entre les deux. Pour ce faire, nous avons utilise la tache du 
gating (Grosjean, 1980) pour presenter des code-switchs dans divers 
contextes. Les sujets ont entendu les stimuli dans des segments 
successivement plus longs (50 msec d’accroissement par presentation) et, 
apres chaque presentation, nous leur avons demande dtcrire le mot qu’ils 
entendaient et d’indiquer le degre de confiance qu’ils avaient dans leur 
reponse. Cette tache nous a permis d’etudier trois variables dependantes : 
le point d’isolement des mots (a savoir, leur point d’identification), le 
degre de confiance a la fin des mots, et les candidats proposes avant le 
point d’isolement. Ces demiers nous ont donn6 un aper^u du processus de 
reconnaissance et de I’apport du contexte dans I'activation des candidats 
de I’une, de I'autre ou des deux langues. Les r^sultats ont ensuite ete 
integres dans le modele d’activation interactive de Grosjean. 

2. M^thode 

Sujets : Quarante-huit bilingues (suisse-allemand - fran^ais), sans problfemes 
d'audition, ont pris part i I'exp^rience qui a dur6 deux heures. Tous les sujets 6taient des 
6tudiants de frangais de luniversit6 de Bale. Pour obtenir une Homog6n6it6 maximale du 
groupe, nous nous sommes limit6s k des 6tudiants qui avaient d6j^ fait au moins quatre 
semestres d‘6tude. Les sujets utilisaient les deux langues r^guliferement dans leur vie de 
tous les jours» parlant le suisse-allemand en famille et dans la communaut6 baloise et 
parlant le frangais pendant les cours et s6minaires de l'universit6 ainsi qu’avec des 
connaissances francophones. 

Matiriel : Nous avons choisi 32 substantifs (k I'exclusion des substantifs 
composes) qui faisaient partie de la vie quotidienne des sujets et qui pouvaient etre utilises 
comme 6l6ments de la langue de base ou comme 6l6ments de I'autre langue (c’est-k-dire, 
comme code-switchs). Tous les mots ont places dans la deuxifeme partie d'une phrase 
k deux propositions lue en suisse-allemand. Ces stimuli ne se trouvaient jamais k la fin de 
la deuxifeme proposition, mais 6taient toujours suivis de un k quatre mots. La premifere 
proposition contenait un substantif qui pouvait etre enonc6 soit dans la langue de base soit 
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dans I'autre langue (code-switch). Cette structure bipartite nous a perrnis de construire 
quatre types de phrases exp6rimentales ou la deuxi^me proposition 6tait identique : 

Type A) la premiere proposition (en italique ci-dessous) ne contenait pas de code- 
switch (en majuscules) et n’exer9ait pas de contrainte sur le mot experimental (en gras) de 
la deuxi^me proposition. Exemple : Me lehrt in dr Sek, dass DELE MONT e schdni 
Stadt isch (traduction : On apprend au college que DELEMONT est une belle ville). 

Type B) la premiere proposition ne contenait pas de code-switch mais 6tait 
contraignante pour le stimulus. Exemple : Es sage alii Jurassier, dass DELEMONT e 
schdni Stadt isch (traduction : Tons les jurassiens disent que DELEMONT est une belle 
ville). 

Type C) la premiere proposition contenait un code-switch mais n'exer^ait pas de 
contrainte sur le mot experimental. Exemple : Me lehrt im COLLEGE, dass 
DELEMONT e schdni Stadt isch (pour la traduction voir la phrase du type A). 

Type D) la premiere proposition contenait un code-switch et 6tait contraignante pour 
le stimulus. Exemple : Es sage alii JURASSIENS, dass DELEMONT e schdni Stadt 
isch (pour la traduction voir la phrase du type B). 

En nous basant sur ces differents types de construction, nous avons construit 120 
phrases : 60 phrases experimentales qui contenaient un code-switch k reconnaitre et 60 
phrases de remplissage qui contenaient un substantif en suisse-allemand, ceci afin 
d'eviter que les sujets s'attendent syst6matiquement h, entendre un code-switch dans la 
deuxi^me proposition. A ces 120 phrases, nous avons ajout6 8 phrases d'entrainement. 
Nous avons bloqu6 le type de contexte, c’est-k-dire que le groupe A n’entendait que des 
phrases du type A), le groupe B celles du type B), le groupe C celles du type C) et 
finalement le groupe D celles du type D). Chaque groupe a done entendu 15 phrases 
exp6rimentales, 15 phrases de remplissage et 2 phrases d'entrainement. 

Pour nous assurer que les premieres propositions des phrases du type B) et D) 
6taient contraignantes et que celles des phrases du type A) et C) ne l'6taient pas, nous 
avons demande k 13 personnes bilingues d'6valuer k I’aide d'une 6chelle de 1 (peu 
contraignant) k 1 (contraignant) la contrainte des propositions. Un test-t appari6 a 
confirm^ que les propositions contraignantes avaient un niveau de contrainte 
significativement plus 61eve que les propositions non contraignantes (t = -8.803, p < 
0 . 001 ). 

Les 128 phrases ont €i€ lues par une locutrice bilingue sans accent notable k un d6bit 
normal et avec une prosodie r6guH^re. Elies ont ensuite 6t6 digitalis6es sur Macintosh k 
I'aide du logiciel SoundDesigner II. Afin que les deuxi^mes propositions soient 
acoustiquement identiques pour les quatre types de phrases, nous avons s61ectionn6 un 
exemplaire de la deuxi^me proposition parmi les quatre enregistr^es et I’avons appos6e 
aux premieres propositions. Nous avons ensuite prdpard les segments exp6rimentaux de 
la fa^on suivante : lors de la premiere presentation, la phrase dtait entendue jusqu’k la fin 
de "dass" (voir exemples ci-dessus) ; puis, k chaque nouvelle presentation, nous avons 
ajoute 50 msec de plus. Done, k la premiere presentation d'un mot experimental, le sujet 
entendait 0 msec de celui-ci, k la deuxi^me, il entendait 50 msec du mot, k la troisieme, 
100 msec, etc. Lorsque la durde d'un mot experimental ne correspondait pas k un 
multiple de 50, le dernier segment etait incrementd de la durde restante. II faut predser 
que, pour les mots suisse-allemands contenus dans les phrases de remplissage, nous 
avons ajoute k chaque incrementation 60 msec et non 50 msec (une difference de 10 msec 
n'etant pas perceptible pour les sujets) puisque ces mots dtaient plus longs que les mots 
experimentaux . 

Lorsqu'un mot stimulus avait ete entidement prepare, la suite (de un k quatre mots) 
etait segmente mot par mot. Par exemple, en reprenant les phrases presentees ci-dessus. 
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les sujets ont entendu les segments suivants : dass Del^mont s; dass Delimont e schbni ; 
dass Delimont e schoni Stadt et dass Delimont e schoni Stadt isch . 

Apits avoir pr6par6 les series de phrases, nous les avons enregistr^es sur cassette en 
mode mono. Un signal acoustique annongait le d6but d une s6rie et 6tait suivi d un 
silence de trois secondes. Chaque s6rie 6tait suivie d une pause de huit secondes. 

Frocidure : Nous avons r^parti les 48 sujets en quatre groupes de 12, selon les 
quatre types de phrases. Chaque groupe a subdivis6 en deux sous-groupes. Le 
premier a d’abord entendu 16 phrases et, apr^s une pause d’environ cinq minutes, 16 
autres. Le deuxi^me sous-groupe a entendu les phrases dans I’ordre inverse, c’est-^-dire 
les 16 demi^res phrases en premier et les 16 autres en dernier. La premiere phrase de 
chaque partie 6tait une phrase d’entralnement. 

Nous avons conduit les stances de passation en suisse-allemand, la langue 
habituelle de conversation entre Texp^rimentateur (lui-meme bilingue) et les sujets. Les 
instructions 6taient en allemand, la langue 6crite de la Suisse al6manique. Les sujets 
savaient qu'ils allaient devoir reconnaitre des substantifs suisse-allemands et des 
substantifs fran 9 ais dans la deuxi^me proposition d'une phrase suisse-allemande. Nous 
leur avons demand^ d'6couter ces phrases et, apr^s chaque presentation, de faire trois 
operations : 1) ecrire le mot qu'ils pensaient avoir entendu ; 2) indiquer un degre de 
confiance pour le mot propose en entourant un chiffre sur une echelle de 1 (peu certain) k 
10 (certain) ; et 3) indiquer si le substantif appartenait h. la langue suisse-allemande ou ^ la 
langue fran 9 aise en entourant la lettre "D" pour le suisse-allemand et la lettre "F" pour le 
fran 9 ais h droite de lechelle de confiance. Les feuilles de reponse etaient organisees de 
maniere h ce que les sujets ecrivent d'abord un mot, puis donnent un degre de confiance 
et finalement indiquent la langue d’origine du mot. Les sujets avaient 8 secondes pour 
accomplir ces trois taches. Nous avons demande k nos sujets de donner une reponse 
apres chaque presentation, meme s’ils etaient tr^s peu surs de leur reponse. 

Analyse des donnies : Nous avons analyse trois variables dependantes : le point 
d'isolement du mot stimulus, le degre de confiance k la fin du stimulus et les candidats 
proposes avant le point d'isolement. 

Le point d’isolement, k savoir le point ou le sujet propose le stimulus et ne change 
pas d’avis par la suite, nous a permis de determiner k quel moment le mot a ete identifie 
correctement. Nous avons exprime ce point en pourcentage de la durde totale du mot. 
L’orthographe et I’indication "D" ou "F” des sujets nous ont aide k definir de mani^re 
exacte le point d’isolement. Nous avons egalement etudie le degre de confiance k la fin du 
stimulus. Finalement, nous avons analyse les candidats errones avant le point d’isolement 
en fonction de la langue k laquelle ils appartenaient. 

Lorsqu’une mesure manquait (point d’isolement, degre de confiance), ce qui arrivait 
lorsque le sujet n’identifiait pas du tout le stimulus ou seulement apr^s la fin de celui-ci, 
ou encore s’il refusait de donner un degre de confiance, la mesure etait remplacee par la 
moyenne de tous les sujets pour le stimulus conceme. Cela a repiesente 5.97% des points 
d’isolement et 6.67% des degres de confiance. 

3. Resultats et discussion 

Le point d'isolement 

La Figure 1 (page suivante) pr6sente le point d'isolement, exprime en 
pourcentage, en fonction de la contrainte semantique (faible et forte) et de 
I'occurrence d'un code-switch precedent (sans et avec). 
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Figure 1. Points d'isolement du mot {%) en fonction de la contrainte 
s6mantique (faible et forte) et de I'occurrence d'un code-switch 
pr6c6dent (sans et avec). 



Comme nous pouvons Tobserver, il existe un effet de contrainte 
(hauteur diff6rente des deux groupes de barres) et un effet de densite 
(hauteur differente des deux barres dans chaque groupe). En effet, dans la 
condition de contrainte semantique faible (les phrases des types A et C), 
les sujets reconnaissent un code-switch apres 51.3% lorsqu'il n'y a pas de 
code-switch precedent et apres 47.7% s'il est precede par un autre code- 
switch. Dans la condition de contrainte semantique forte (les phrases des 
types B et D), le point d'isolement pour les stimuli sans code-switch 
prec6dent se trouve a 39.5% et a 35.7% lorsqu'ils sont precedes d'un 
autre code-switch. Nous avons fait deux analyses de variance et avons 
trouv6 un effet significatif de la contrainte semantique lors de I'analyse 
par mots : F (1,14) = 12.22, p < 0.01, ainsi que lors de I'analyse par 
sujets : F (1,44) = 55.04, p < 0.001. Ces analyses ont egalement montre 
qu'il existait un effet de density des code-switchs entre les phrases 
contenant un code-switch precedent et les phrases n'en contenant pas, 
aussi bien dans I'analyse par mots, F (1,14) = 5.09, p < 0.05, que dans 
I'analyse par sujets, F (1,44) = 5.27, p < 0.05. Aucune interaction n'a ete 
trouv6e entre les deux variables. 
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De ces analyses, nous pouvons retenir les points suivants. 
Premi^rement, I’effet de la contrainte s6mantique est present et influence 
le traitement des code-switchs dans le mode bilingue en acc616rant leur 
reconnaissance. Ceci est valable pour les phrases sans code-switch 
precedent ainsi que pour celles avec code-switch pr6c6dent. Ce r6sultat 
confirme I’effet "contexte" que Ton trouve a maintes reprises dans la 
litt^rature mais ajoute un fait nouveau : le contexte influence les mots des 
deux langues chez Tauditeur bilingue, ceux de la langue de base et ceux de 
la langue alternative (au moins en mode de communication bilingue). 
Deuxi^mement, I’auditeur identifie plus rapidement un code-switch dans 
une phrase si celui-ci est pr6c6d6 d’un autre code-switch. La presence 
d’616ments de I’autre langue active done davantage le lexique de cette 
langue et faeces se fait plus rapidement puisque les mots qu'elle contient 
ont besoin de moins d'excitation pour atteindre leur seuil d'activation. 
Troisiemement, il n’existe pas d'interaction entre I'effet contrainte et 
I’effet densite. Cela signifie que les deux effets accel^rent la 
reconnaissance d’un code-switch mais qu'ils ne s'influencent pas 
mutuellement. 

A partir de ces r^sultats, nous pouvons ^mettre I'hypoth^se que les 
deux variables influencent probablement de maniere diff^rente le 
processus de reconnaissance. Le contexte interviendrait depuis un niveau 
sup6rieur et serait done une information descendante. Par contre, la 
density des code-switchs aurait un effet ascendant, car ce sont les 
informations phon^tiques des code-switchs pr^c^dents qui augmentent le 
niveau d’activation de la langue d’ou ils proviennent. Lorsqu’un code- 
switch apparait, la langue alternative est encore plus activee et la 
reconnaissance du mot se fait done plus rapidement. 

Le degre de confiance 

La Figure 2 (page suivante) montre le degre de confiance k la fin du 
mot en fonction de la contrainte semantique (faible et forte) et de 
Toccurrence d’un code-switch pr^c^dent (sans et avec). 
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Figure 2. Degr6s de confiance h la fin du mot en fonction de la 
contrainte s6mantique (faible et forte) et de Toccurrence d’un code- 
switch pr6c6dent (sans et avec). 

Nous constatons peu de diff6rence au niveau de la contrainte 
semantique mais une diff6rence plus grande au niveau de la densite. En 
effet, il existe un degr6 de confiance moyen de 9.3 dans la condition de 
contrainte faible ainsi que dans la condition de contrainte forte lorsque le 
stimulus n’est pas pr6c6de d’un autre code-switch (phrases des types A et 
B). Par contre, si le stimulus est precede d'un autre code-switch, la 
moyenne globale pour la condition de contrainte faible est de 9.5 et pour 
la contrainte forte de 9.9 (phrases des types C et D). Deux analyses de 
variance confirment qu'il existe une difference significative entre les 
stimuli precedes d’un autre code-switch et les stimuli qui ne le sont pas. 
Nous avons trouve cet effet dans I'analyse par mots (F (1,14) = 9.51, p < 
0.01) et dans I’analyse par sujets (F (1,44) = 5.93, p < 0.05). Par contre, 
I’effet de contrainte n'est pas significatif et il n'existe pas d'interaction. 

Ces r6sultats confirment en partie ceux obtenus pour le point 
d'isolement. Un code-switch est reconnu avec plus de confiance s'il est 
pr6c6d6 d’un autre code-switch que ce soit dans une situation de 
contrainte faible ou de contrainte forte. Par contre, I’absence d'un effet 
de contrainte, ici, est probablement due au fait que les valeurs des degres 
de confiance des quatre types de contexte se rapprochent les unes des 
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autres vers la fin des stimuli, n semble que les informations contextuelles 
dans les conditions de contrainte forte et faible soient suffisantes pour 
neutraliser les valeurs vers la fin des stimuli, ce qui produit un effet 
plafond des courbes lors de la presentation des demiers segments. 
L'absence d'un effet plafond pour la variable density s'explique par le fait 
qu'un premier code-switch indique h I'auditeur bilingue la presence 
possible d'autres elements de la langue alternative ce qui implique, lors de 
la presence effective d'un deuxieme code-switch, que la reconnaissance de 
celui-ci se fait avec plus de confiance. 

Le processus d'isolement des code-switchs 

La Figure 3 ci-dessous pr€sente le nombre moyen de candidats 
frangais en fonction de la dur€e des segments et du type de phrase 
contextuelle (A, B, C, D). Les resultats obtenus pour les sept premiers 
segments ont 6i€ retenus. 




TYPE A 
TYPE B 
TYPE C 
TYPE D 



DUREE DES SEGMENTS (msec) 

Figure 3. Nombre moyen de candidats fran 9 ais en fonction de la 
dur6e des segments et du type de phrase contextuelle (A, B, C, D). 



Nous remarquons tout d'abord un effet tout h fait clair de la langue 
de base. En d6but de mot, les sujets sont influences par la langue 
"porteuse" (le suisse-allemand) et ne proposent done que peu de candidats 
fran^ais. Ce n'est que lorsque I'information acoustico-phonetique du 
code-switch arrive (dans les segments successifs) que les sujets 
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commencent k proposer des candidats de Tautre langue. Nous constatons 
6galement que le nombre de candidats franfais est plus important quand 
les stimuli sont pr^ced^s d'un code-switch ou quand la contrainte 
s^mantique est forte. En effet, nous trouvons 5.8 candidats fran^ais en 
moyenne pour les phrases qui contiennent un code-switch pr^c^dent 
(types C et D) contre 5.1 candidats pour celles qui n'en ont pas (types A 
et B). De plus, nous obtenons plus de candidats fran^ais lorsque la 
contrainte semantique est forte (types B et D; moyenne de 5.9) que 
lorsqu’elle est faible (types A et C; moyenne de 4.9). Une analyse de 
variance confirme que ces effets sont significatifs (density : F (1,98) = 
29.68, p < 0.001; contrainte semantique : F (1,98) = 21.68, p < 0.001). 

4. Discussion generate 

Les resultats de cette etude ont montre I’importance des deux 
variables testees. La premiere, la densite des code-switchs, a ete mise en 
evidence par le point d’isolement des mots (les stimuli precedes d’un autre 
code-switch sont identifies plus rapidement que les autres), par le degre 
de confiance (les stimuli sont reconnus avec plus de confiance) et par les 
candidats proposes lors des premiers segments (les phrases qui sont 
precedees d’un code-switch obtiennent plus de candidats fran 9 ais que 
celles qui ne le sont pas). Pour expliquer ces resultats, nous avons emis 
I’hypothese qu’un code-switch precedent active davantage de candidats de 
I’autre langue, ce qui fait que le mot stimulus, s’il s'agit d’un code-switch, 
sera reconnu plus rapidement. 

Quant a la deuxieme variable, la contrainte semantique, nous avons 
trouve un effet significatif avec le point d’isolement (qui est precoce en 
contexte contraignant) et les candidats proposes lors des premiers 
segments (qui appartiennent a I’autre langue lorsque le contexte active 
celle-ci). Nous en avons conclu que la contrainte semantique fonctionne 
de maniere descendante et active les mots de I'autre langue lorsque le 
contexte fait appel k elle. 

A partir de ces resultats, certaines modifications peuvent etre 
apportees au modele de Grosjean (1988). Celles-ci sont en italique afin de 
les differencier des propositions d’origine. 

1. En mode de communication bilingue, les deux langues sont activees 
mais la langue de base Test plus fortement. Le niveau d’activation de la 
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langue alternative peut etre modifi6 tout au cours de I'interaction. 
Deux variables peuvent augmenter ce niveau : la presence de code- 
switchs precedents et la contrainte semantique et pragmatique. La 
premiere variable (la densite des code-switchs) fonctionne comme 
information ascendante et augmente Vactivation de la langue 
alternative, facilitant ainsi la reconnaissance des code-switchs. La 
contrainte semantique, quant a elle, est une information descendante 
qui active plus fortement les mots de la langue alternative lorsque 
celle-ci est appropriee a la situation ( inter locuteurs, sujets, etc). 

2. L’activation d'une unit^ dans une langue (phoneme, syllabe, mot, etc.) 
et de Vun\i€ correspondante dans Tautre (si elle existe) depend de leur 
deg re de similitude. 

3. L'activation des unites sp^cifiques a une langue (traits, phonemes, 
syllabes) augmente l'activation globale de cette langue et acc^lere done 
la reconnaissance des mots de celle-ci. 

4. L'activation d'un mot specifique a une langue augmente ^galement 
l'activation globale de celle-ci et accelere done la reconnaissance des 
mots qui lui appartiennent. 

5. L'activation de mots qui se ressemblent dans les deux langues 
(homophones inter-langues) ralentit la reconnaissance des code-switchs 
et des emprunts. La frequence des homophones (avec leurs taux 
d'activation differents) et la configuration phon^tique du mot 
influencent le processus de reconnaissance en I'acc^lerant ou en le 
freinant. 

6. Lorsque le contexte semantique et pragmatique exerce une contrainte 
sur la langue alternative, celle-ci devient plus active et les mots qui en 
font partie sont reconnus plus rapidement. 

La presente etude a r^ussi k affiner le modele de Grosjean (1988) en 
lui permettant de rendre compte de deux nouveaux effets : la density des 
code-switchs et la contrainte semantique. Une autre etude sera necessaire 
pour confirmer les resultats presentes ici et pour montrer que ce n'est pas 
une contrainte semantique quelconque qui active les mots de la langue 
alternative mais seulement celle qui correspond aux domaines d'utilisation 
de cette langue. 



72 Uaccis au lexique de code-switchs 



5. Bibliographie 

GROSJEAN, F. (1980): "Spoken word recognition and the gating 
paradigm", Perception and Psychophysics, 28, 267-283. 

GROSJEAN, F. (1988): "Exploring the recognition of guest words in 
bilingual speech". Language and Cognitive Processes, 3 (3), 233-274. 

McClelland, J. & J. ELMAN, (1986): "The TRACE model of speech 
perception". Cognitive Psychology, 18, 1-86. 





TRANEL (Travaux neuchdtelois de linguistique), 1994, 21,73-84. 



73 



Caract^risation des structures de performance en fran^ais 
Pascal Monnin 



R^sum^ 



II est possible, grace k diverses taches exp^rimentales, d'obtenir la 
structure de performance dune phrase. Celle-ci est caract^ris^e par un certain 
nombre de propri6t6s fondamentales et peut etre pr6dite k I'aide d'algorithmes 
divers. Jusqu'^ present les recherches ont port^ principalement sur I'anglais et 
nous nous toumons done dans cette ^tude vers les structures de performance 
du fran 9 ais en caract^risant les structures obtenues k I'aide d'une tache de 
lecture orale. 

1. Introduction 

Nous savons depuis quelque temps qu'il est possible, grace k des 
taches experimentales diverses telles que le rappel, la lecture et la 
segmentation subjective, d’obtenir la structure hi6rarchique d'une phrase 
(Grosjean, Grosjean & Lane, 1979 ; Dommergues & Grosjean, 1981 ; 
Gee & Grosjean, 1983). Cette structure, que Ton a nommee "structure de 
performance", est construite uniquement k partir de mesures dependantes 
(probabilit6 de rappel, dur6e des pauses, indice de segmentation, etc.) et 
peut etre caracterisee par un certain nombre de propri6tes fonda- 
mentales : unit6s de base de longueur plus ou moins egale, organisation 
hierarchique et structure symetrique (Grosjean & Dommergues, 1983). 
La structure de performance d’une phrase correspond moins k son 
organisation syntaxique qu’a sa structure prosodique (les expressions 
"structure de performance" et "structure prosodique" sont devenues 
synonymiques demi^rement) et peut etre pr6dite de maniere satisfaisante 
a I’aide de diverses variables telles que la nature, la longueur et le schema 
accentuel des mots et des constituants, la structure syntaxique de la phrase, 
I’equilibre des constituants, etc. Les travaux sur les structures de 
performance, qui ont porte avant tout sur I'anglais, ont permis de mieux 
comprendre certaines 6tapes de la production d’un 6nonc6 (Levelt, 1989) 
et ont servi de base a la prediction de la prosodie dans la synthese de la 
parole (Bachenko & Fitzpatrick, 1990 ; Quen6 & Kager, 1992 ; Wang & 
Hirschberg, 1992). 
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Obtention des structures de performance 

Un certain nombre d’^tudes sur Tanglais ont montr^ que la frequence 
et la dur^e des pauses entre les constituants d’une phrase sont li^es a sa 
structure syntaxique, mais aussi k des aspects non syntaxiques. Dans une 
premiere 6tude, Grosjean, Grosjean & Lane (1979) ont mis en evidence 
les structures de performance de I’anglais a I’aide des pauses inserees 
entre les mots d’une phrase lors de la lecture lente puis ont tente de 
pr^dire ces structures. 

Pour construire 'Tarbre de performance” a partir des donnees 
exp^rimentales, les auteurs ont employe la procedure iterative suivante : 

a) Prendre la pause la plus courte dans la phrase. 

b) Relier les deux mots (ou groupes de mots) separes par cette 
pause sous un noeud commun. 

c) Ne plus tenir compte de cette pause et r^p^ter le processus 
jusqu’^ ce que toutes les pauses soient effacees. 

Quant k la hauteur des noeuds, elle est proportionnelle a la duree des 
pauses consid6r6es : plus la pause est longue plus le noeud est elev6. 

Les resultats ont montre que les sujets ne groupaient pas 
automatiquement le verbe avec le syntagme nominal qui suit comme une 
structure syntaxique traditionnelle le predirait mais que dans bien des cas, 
une coupure principale etait observee entre le syntagme verbal et I'objet. 

D’autre part, cette etude a montre que les structures de performance 
obtenues ne sont pas le resultat de contraintes de respiration. En effet, la 
meme experience conduite avec un autre groupe de 14 sujets mais sans 
que les sujets reprennent leur souffle au cours de I'enregistrement a 
foumi des resultats pratiquement identiques. Grosjean, Grosjean & Lane 
ont egalement mis en evidence le fait que ces structures sont invariables 
d’une tache k I’autre. Un troisi^me groupe de sujets avaient pour tache de 
trouver une coupure principale dans chacune des phrases, de la numeroter 
du chiffre 1 puis en considerant independamment les deux parties 
obtenues, de les segmenter a leur tour en num^rotant la frontiere la plus 



ERIC 




P. Monnin 75 



importante du chiffre 2 et ainsi de suite jusqu'a ce que chaque frontiere 
de mot soit numerot6e. 

Les structures hierarchiques obtenues a partir de ces valeurs de 
segmentation ont permis de constater que les r^sultats sont tres 
comparables, II y a une forte correlation entre les indices de segmentation 
et les dur^es de pauses converties en pourcentages. 

Proprietes des structures de performance 

Trois proprietes principals ressortent de Texamen des structures de 
performance : 

a) Les structures prosodiques sont composees d'unites de base de 
longueurs plus ou moins egales. Sur I'ensemble des quatorze phrases 
utilisees dans I'etude de Grosjean, Grosjean & Lane, on obtient une 
moyenne de trois syllabes par groupe prosodique, le nombre de 
syllabes variant de un a huit. 

b) Les structures de performance sont organisees hierarchiquement. 
Les unites de base se regroupent en unites de niveau sup6rieur qui, a 
leur tour, se regroupent au sein dunit^s plus grandes, 

c) Les structures de performance sont plus ou moins sym6triques, Cette 
propri6t6 de sym^trie fait que les structures de performance, au 
contraire des structures syntaxiques, sont rarement d6rivees a droite, 

Les structures de performance en frangais 

Dans cette etude, nous nous tournons vers les structures de 
performance du frangais afin de determiner dans quelle mesure les 
principes adopt^s pour I’anglais sont egalement pertinents pour cette 
langue. Bien que les travaux sur la structuration prosodique en frangais 
soient fort nombreux (voir, entre autres, Auberge, 1991 ; Bailly, 

1989 ; Caelen-Haumont, 1991 ; Hirst, 1987 ; Llorca, 1984 ; Pasdeloup, 

1990 ; Rossi, 1985 ; Vaissiere, 1980), il nous a semble important de 
mener une premiere 6tude exploratoire dans laquelle nous adapterions 
I’approche utilisee jusqu'a present en anglais afin de caract^riser les 
structures de performance du frangais oral. Nos objectifs sont, dune part, 
d'^tudier les structures de performance d'une langue qui poss^de une 
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organisation prosodique tres differente de I'anglais et, d'autre part, 
d’apporter un complement d’information aux travaux des chercheurs cit6s 
ci-dessus. En effet, la m6thodologie utilis6e dans nos travaux nous permet 
d’obtenir une hi6rarchie prosodique tr^s fine de la phrase, d’isoler les 
unites prosodiques et de quantifier I’importance des coupures qui existent 
entre elles. 

Dans cette etude nous caracteriserons les structures de performance a 
I’aide d’une tache de lecture orale. Pour ce faire, nous utiliserons 
I’approche adoptee dans les etudes anglaises (voir Grosjean, Grosjean & 
Lane, 1979) et ceci pour des raisons de simplicite experimentale. Nous 
avons done choisi de calculer Timportance des frontieres interlexicales 
afin de caracteriser la structure prosodique de nos enonces. Nous 
chercherons en particulier a evaluer si les caracteristiques de symetrie, de 
hierarchie et de longueur egale des unites de base se retrouvent en 
fran^ais. De plus, nous observerons I'impact de certaines variables telles 
que la position des adjectifs (proposes ou postposes) et le statut prosodique 
de certains mots grammaticaux. 

2. Methode 

Sujets : Huit sujets, tous de langue matemelle fran 9 aise, ont participe ^ cette etude. 

Matdriaux : Neuf phrases simples, d une longueur de quinze syllabes, ont servi de 
materiel experimental. Afin d'obtenir une certaine variete dans ces phrases, nous avons 
fait varier la longueur des groupes nominaux sujet et objet en modifiant le nombre de 
mots lexicaux (et done la structure du groupe) dans les cinq premieres phrases et la 
longueur de ces mots dans les quatre autres. 

1) (La fille) s'est deguisee en (une jolie petite f6e espiegle). 

2) (La petite fille) s'est d6guis6e en (une jolie f6e espiegle). 

3) (La fille espiegle) s'est d6guis6e en (une jolie petite f6e). 

4) (La jolie petite fille) s'est d6guis6e en (une f6e espiegle). 

5) (La jolie petite fille espiegle) s'est d6guis6e en (une f6e). 

6) (La dame chic) poss^e (un spectaculaire chat indon^sien). 

7) (Le voisin ag6) possede (un magnifique chat japonais). 

8) (Le professeur sympathique) poss^e (un joli chat tigr6). 

9) (Le propri6taire accommodant) poss^e (un beau chat blanc). 

Procedure : Avant d'etre pr6sent6es aux sujets, les phrases ont 6t6 tap6es dans un 
ordre al6atoire sur des bandes de papier. Les sujets ont enregistr^s individuellement 
au moyen d'un magnetophone ^ cassette SONY WM-D3. Ils ont d'abord pris 
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connaissance de chaque phrase et Tom lue ensuite h deux debits, d’abord normal et 
ensuite lent 

Analyse des donnies : Nous avons obtenu 16 enregisirements pour chaque phrase 
(8 sujets, 2 lectures par sujet) que nous avons digitalises h. I’aide du syst^me 
MacRecorder rattache h un ordinateur Macintosh SE. Les traces oscillographiques 
obtenus nous ont permis de mesurer la dur6e des voyelles et des pauses en fin de mots. 
Contrairement k I’approche utilisee pour I’anglais, ou on ne mesure que la dur6e de la 
pause silencieuse, nous avons opt6 ici pour une mesure plus complexe. En effet, la 
predominance des syllabes ouvertes en fran 9 ais permet au locuteur de marquer une 
coupure temporelle soit par I’allongement de la demiere syllabe du mot, soit par 
Tinsenion d'une pause silencieuse, soit par les deux approches k la fois (Duez, 1987). 
Nous avons done decide d’inclure dans ce que nous appelons ici "voyelle + pause" 
(dorenavant V+P), la duree du noyau (la voyelle) de la syllabe precedant une coupure 
entre deux mots ainsi que la duree de la pause silencieuse (sans limite inferieure) entre ces 
mots. Nous n’avons pas tenu compte de la consonne finale (lorsque celle-ci etait 
presente) afin d’obtenir la meme mesure k chaque coupure de mot, certains mots se 
terminant avec une voyelle, d’autres avec une voyelle et une consonne, d’autres encore 
avec une voyelle et deux consonnes*. La mesure V+P est done toujours compos^e au 
moins de la dur6e du noyau ; la dur6e de la pause silencieuse vient s’y ajouter lorsqu’un 
arret est 6galement present dans I’onde sonore. Notons que cette mesure nous permet 
d’obtenir une valeur entre chaque mot de la phrase, meme k d6bit normal, ce qui n’est 
pas normalement possible avec la seule dur6e des pauses silencieuses (les sujets ne 
faisant pas de pauses k I’int^rieurdes constituants ou entre constituants mineurs k d6bit 
normal). Nous avons ensuite calculi la moyenne des V+P, pour chaque phrase, sur 
I’ensemble des sujets et avons convert! ces valeurs en pourcentages bas6s sur la somme 
totale des V+P dans la phrase^. 

Avant meme de consiruire les structures de performance de chacune de nos phrases k 
I’aide des valeurs obtenues, nous avons du choisir entre les V+P obtenues k debit 
normal, k d6bit lent ou aux deux debits k la fois. Rappelons que dans les Etudes ponant 
sur I’anglais, une moyenne basde sur I’ensemble des debits 6tait utilis6e car au seul d6bit 
normal les pauses ne sont pas assez nombreuses et ne p>ermettent done pas la construction 
d’arbres hi^rarchiques complets. Nous avons calculd, a I’aide des valeurs V+P, les 
correlations entre les deux debits pour les neufs phrases et avons obtenu une correlation 
moyenne de 0,86. Devant cette valeur eievee, qui indique une forte ressemblance des 
structures de performance k debit normal et k debit lent, et etant donne que notre objectif 
etait avant tout d’etudier la structure prosodique d’une phrase k debit normal, nous avons 
decide de ne pas tenir compte des durees k debit lent. Nous avons done construit pour 
chacune des neuf phrases, et k I’aide des valeurs V+P obtenues k debit normal, une 
structure de performance en suivant la procedure iterative decrite dans I’introduction. 
(Nous avons simplement remplace la pause par la valeur V+P). Cette procedure, qui peut 
egalement etre utilisee avec d’autres variables dependantes (probabilite de rappel, indice 
de segmentation, etc.), permet de representer visuellement les structures de performances 
et ainsi de les decrire plus facilement. 



\ Dans une etude pilpte, nous avons remarque que si la hauteur des noeuds les plus bas 
des structures de performance poiivait changer legerement lorsqu’on inclut la consonne 
dans les mesures, les constituants prosodiques majeurs restaient les memes. 

2 Les donnees ont ete convenies en pourcentages afin de suivre au plus pits la procedure 
utilisee dans les etudes precedentes et ne pas donner trop d’imponance aux valeurs d’un 
seul sujet qui aurait pu avoir, grace k un debit tres lent (ou tres rapide), des duites V+P 
beaucoup plus longues (ou plus courtes), que les autres sujets. 
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3. R^sultats et discussion 

La s6rie de structures obtenue montre que les trois proprietes 
fondamentales des structures de performance qui ressortent en anglais 
(Grosjean & Dommergues, 1983 ; Gee & Grosjean, 1983) se retrouvent 
dans les structures du fran 9 ais, k savoir la sym^trie, la hi^rarchie et la 
longueur plus ou moins egale des unites de base^. Concemant la symetrie, 
nous observons que la frontiere prosodique principale est situee vers le 
milieu de la phrase et ne correspond done pas toujours a la coupure 
syntaxique principale. Dans la figure 1 (voir page suivante), le syntagme 
nominal sujet "la fille" est court et contraint le locuteur a marquer une 
coupure principale apres le verbe "s'est d6guis6e" pour des raisons de 
symetrie. II s’ensuivra, comme nous le verrons ci-dessous, que la seule 
structure syntaxique d’une phrase n’est pas forc^ment un bon predicteur 
de la structure de performance. En ce qui concerne la deuxieme 
caract^ristique, la hierarchie, nous remarquons dans nos phrases que les 
unites de base se regroupent en unites plus grandes qui, elles-memes, sont 
regroup^es en unites encore plus larges. Dans la meme figure, par 
exemple, "la fille" est rattache a "s’est deguisee" tandis que "en une jolie" 
est rattache a "petite fee" et a "espiegle". Ces deux groupes sont ensuite 
regroup^s au niveau sup^rieur. Enfin, troisieme caracteristique, les 
structures de performance en fran 9 ais, comme celles de I’anglais, sont 
constitutes d’un certain nombre d’unites prosodiques de longueurs plus 
ou moins tgales, unitts qui ne correspondent pas toujours a un constituant 
syntaxique. Par exemple, dans la figure 1, le syntagme prtpositionnel "en 
une jolie petite fille espiegle" est decompose en trois unites prosodiques 
distinctes, "en une jolie", "petite fee" et "espiegle". Ces unites de base ne 
semblent pas exetder un certain nombre de syllabes qui est sensiblement 
le meme pour chaque unite. Ainsi, toujours dans la meme phrase, on 
distingue 5 groupes prosodiques de base dont le nombre de syllabes varie 



3 Notons que ceci est vrai pour les structures de chacun des sujets. En effet, nous avons 
corrtlt, pour chaque phrase, les valeurs V+P de chaque sujet avec celles de chacun des 
autres sujets puis avons obtenu la moyenne des corrtiations. Nous avons ensuite calculi 
la moyenne pour chaque phrase et avons finalement rnoyenn^ ces 9 moyennes. Le r6sultat 
final est de 0,84, ce qui signifie que la structure de performance d'une phrase produite par 
un sujet est fort semblable k celles produites par les autres sujets. Bien qu'il existe 
quelques petites divergences entre sujets, la configuration g6n6rale des structures 
individuelles est pratiquement identique et revile les trois memes caract^ristiques de base. 
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PHRASE 1 



Structure de surface 
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la fille s'est d^guisee en une jolie petite f6e espiegle 



Structure de performance 
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Fig. 1. - Structure de surface et structure de performance de la phrase 1. 
La structure de performance est ^laborde k partir des dur^es des V + P 
converties en pourcentages. 



entre 2 et 4 : "la fille", "s'est d6guis6e", "en une jolie", "petite fille" et 
"espiegle". 



Sur I'ensemble des phrases, la longueur moyenne des unites 
prosodiques sdparees par une V+P de 12% ou plus (dans la distribution 
des effectifs des V+P il existe une rupture a 12%) est de 3,46 syllabes 
(6cart-type de 1,43). Cette troisi^me caract6ristique explique le 
ddcoupage des syntagmes nominaux sujets que Ton trouve dans les 
phrases 6 "la dame chic possMe un spectaculaire chat indonesien" et 9 "le 
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propri^taire accommodant possede un beau chat blanc", syntagmes qui 
ont exactement la meme structure syntaxique. D’un c6t6 "la dame chic" 
(phrase 6) forme un seul groupe prosodique de 3 syllabes alors que dans 
la phrase 9, "le propri6taire accommodant" est form6 de deux unites 
prosodiques distinctes de 5 et de 4 syllabes respectivement. 

En plus de ces trois propri6t6s fondamen tales, deux autres caracteris- 
tiques ressortent de nos resultats. La premiere conceme les adjectifs 
postpos6s qui semblent avoir un statut prosodique particulier. En effet, 
dans la phrase 1 (figure 1, structure du bas), on observe une V+P 
importante entre "fille" et "espiegle" et dans la phrase 6 (figure 2, struc- 
ture du haut ^ gauche ; voir page suivante) on remarque une V+P plus 
longue (24,5) entre le substantif ("chat") et I’adjectif postpose ("in- 
don6sien") qu’entre I’adjectif prepos6 ("spectaculaire") et le substantif 
(13,5), bien que les deux adjectifs aient la meme longueur. Notons que 
Timportance de la coupure entre le substantif et I'adjectif postpose, dont 
nous devrons tenir compte lors de la prediction des structures de per- 
formance, peut etre reduite lorsque d'autres variables entrent en jeu, 
telles que la longueur de I’adjectif (V+P de 7,5 entre "chat" et "blanc" 
dans la phrase 9), le lien semantique qui existe entre I'adjectif et le 
substantif, et la nature des phonemes presents de part et d'autre de la 
coupure (deux voyelles, une consonne et une voyelle, etc.). 

Un deuxieme aspect qui ressort des structures de performance du 
fran9ais conceme le rattachement de certains mots grammaticaux. 
Normalement ceux-ci sont rattaches prosodiquement aux mots lexicaux de 
droite comme dans le cas de "une" qui est rattach6 h "jolie" dans la phrase 
1 (figure 1). Cependant, il semblerait que dans certains cas les mots 
grammaticaux peuvent se rattacher aussi aux mots lexicaux de gauche. 

Ainsi, dans la phrase 9 (figure 2), "un" est rattach6 prosodiquement ^ 
"possede" et non, comme on pouvait s'y attendre, a "beau". 

4. Conclusion 

La caract6risation des structures de performance en fran9ais fait 
appel h des caract6ristiques prosodiques plus complexes que pour 
I’anglais. D6j^ dans I’obtention de la mesure d6pendante (duree V+P), 
nous avons du prendre en consideration non seulement la duree de la 
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Fig. 2. - Structure de surface a structure de performance des phrases 6 et 9. Les structures 
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pause silencieuse interlexicale, comme cela a toujours 6tt le cas dans les 
Etudes sur I'anglais, mais ^galement la duree de la voyelle de la syllabe en 
fin de mot. Bien que les structures de performance du franfais partagent 
les trois memes propri^t^s fondamentales que celles observ^es en anglais 
(sym^trie, hi^rarchie et unites prosodiques de longueur plus ou moins 
6gale), nous avons pu mettre en valeur d’autres caract^ristiques tout a fait 
interessantes : le statut de noyau prosodique de I'adjectif postpose et le 
rattachement a gauche de certains mots grammaticaux. 

Dans la continuation de cette 6tude, nous avons elabore un algorithme 
de prediction^ (algorithme MG) permettant de pr^dire nos structures de 
performance. II s’avere etre un bon pr^dicteur des structures de 
performance des phrases experimentales et il rend compte des diff^rentes 
propri6t6s generates des structures (hierarchie, sym^trie, unites de base de 
longueur plus ou moins egale). De plus, il traite d'autres aspects que nous 
avons trouves specifiquement dans notre etude : le cas de I'adjectif 
postpos6 et celui du rattachement a gauche de certains mots 
grammaticaux, entre autres. 

Deux domaines de recherche sont susceptibles de beneficier des 
travaux portant sur les structures de performances. D’une part, en 
traitement automatique de la parole, une meilleure description des 
structures prosodiques du fran 9 ais oral et le developpement d'algorithmes 
de prediction peuvent contribuer a ameiiorer la qualite de la synthese a 
partir du texte, comme cela a deja ete le cas en anglais (voir Bachenko & 
Fitzpatrick, 1990 ; Quene & Kager, 1992 ; Wang & Hirschberg, 1992). 
D'autre part, en psycholinguistique, une comprehension approfondie de 
ces structures aura des consequences sur I'eiaboration des modeles de 
production et de perception de la parole. 
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Le traitement de la liaison chez I'enfant : Etudes exp^rimentales 

Eliane Morel 



R^sum^ 



Notre propos dans ces Etudes exp^rimentales est de d^montrer que la 
liaison est un ph^nom^ne langagier qui n'est pas per^u tout de suite par les 
enfants, mais dont I'acquisition des regies depend du d^veloppement du 
langage. Nous avons abord^ le traitement de la liaison en nous int^ressant k 
sa production dans deux situations diff^rentes: une ^preuve de pseudo- 
denomination d'images (etude n°l) et une epreuve de repetition de phrases k 
debit lent (etude n°2). Dans la premiere etude nous avons teste un groupe de . 
jeunes enfants afin de pouvoir determiner la pertinence de la presence de 
liaisons dans I'identification des mots. La seconde etude permet de comparer 
le comportement d'un groupe d'adultes k celui de deux groupes d'enfants. 

1. Introduction 

Un survol non exhaustif de la litterature concemant les domaines de la 
liaison et du lexique nous a amen6s k plusieurs constatations. Tout d*abord, 
I'identification des mots dans la chaine pariee necessite I'utilisation de 
processus sp6cifiques et implique une tache d'acces au lexique. En effet, 
afin d'identifier les differentes unites significatives d'un message, 
I'auditeur doit utiliser des strategies lui permettant d'isoler les mots les uns 
des autres. Dans la litterature on trouve ces strategies sous le nom de 
strategies de "segmentation" (Fox & Routh, 1975 ; Wijnen, 1988 ; Chaney 
1989). 

Lorsqu'un auditeur est confronte k un mot pour la premiere fois, il ne 
peut identifier cet item qu'en reconnaissant les mots avant et apres celui-ci 
et en isolant ainsi le mot nouveau. II effectue pour cela une tache d'acces k 
son lexique interne (ou sont stockes tous les mots qu'il connait) en scrutant 
le signal de parole et en recherchant I'apparition d'items lexicaux possibles 
(Cole & Jakimik, 1980 ; Klatt, 1975). II les stocke ensuite dans son lexique 
interne afin de pouvoir y acceder s'il le rencontre a nouveau ou s'il est 
amen6 k le produire. 
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Des 6tudes experimentales ont revele que les entries lexicales 6taient 
diff6rentes chez I'enfant et chez Tadulte, done que I'organisation du lexique 
interne n’6tait pas fix6e une fois pour toute (Postman & Keppel, 1970 ; Fay 
& Cutler, 1977 ; Charles - Luce & Luce, 1990). File est modifiee par la 
n6cessit6 de Stocker de nouveaux items. 

Nooteboom (1981) a 6tabli que Tacces lexical semble etre plus facile a 
partir des fragments initiaux des mots paries qu'a partir des fragments 
finaux. Wijnen (1988), en 6tudiant les strategies de segmentation en 
syllabes chez des enfants de 2 a 3 ans, a remarque que la production de la 
parole 6tait d’abord organisee en unites syllabiques avec une preference 
pour la forme C.V. (consonne - voyelle). Ces deux constatations se 
rev^lent importantes dans le cas de la liaison. En effet, la liaison se situe 
precis6ment au debut du mot et consiste en la "reconstitution" d'une 
sequence consonne-voyelle. 

Deux auteurs se sont interesses plus particulierement au domaine de la 
liaison : Malecot (1975) et Tranel (1987), qui concluent que la liaison 
depend de la cohesion syntaxique entre les mots et qu'elle tend a apparaitre 
plus volontiers si elle signale une marque morphologique precise (par 
exemple le pluriel) que si elle ne represente aucune information 
grammaticale precise. 

A notre connaissance, aucune etude concemant le domaine de la liaison 
n’a ivt r6alisee avec une population enfantine. Et bien que Malecot (1975) 
cite que la tendance a produire des liaisons s’accroTt lorsque Ton passe a un 
d6bit d’61ocution plus lent, nous ne savons pas comment se comportent des 
adultes si on leur demande de r6peter a debit lent des phrases comportant 
des liaisons. 

Dans la premiere 6tude, nous nous sommes interesses a savoir si pour 
les jeunes enfants la presence de liaisons etait un facteur pertinent dans 
I'identification et le stockage des mots dans le lexique. Nous avons 
compare, pour des mots frequents et des mots rares, la tendance dans une 
epreuve de "pseudo-d6nomination" d’images a maintenir de maniere 
erron6e une liaison propos6e. Nos questions experimentales etaient les 
suivantes : 
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1) Dans une dpreuve de "pseudo-denomination" d'images, les jeunes 
enfants ont-ils tendance ou non h maintenir de manifere erronee une liaison 
proposee lors de la presentation orale d’un mot ? 

2) Cette tendance h maintenir de mani^re erronee des liaisons 
proposees (si elle existe) est-elle identique si le mot present^ est un mot 
rare ou s’il s’agit d'un mot frequent ? 

La deuxidme 6tude s’interesse h la production de la liaison dans un 
contexte specifique: celui de la repetition de phrases k debit lent. Nos 
questions etaient les suivantes : 

1) Lors d’une tache de repetition a debit lent, les enfants maintiennent- 
ils plus souvent que les adultes les liaisons proposees ? 

2) Peut-on mettre en evidence le role de facteurs morphologiques 
(nature de la consonne de liaison) et/ou syntaxiques (nature gramma ticale 
des mots impliques dans la liaison) dans la tendance a maintenir des liaisons 
en repetition a debit lent ? 

2. ”Pseudo-D^nomination” dHmages 

2.1. Methode 

Sujets : 10 enfants ages de 3,9 ans h 4,6 ans ont 6i6 tesids. Ces enfants sont tous 
prescolaires et domicilies dans le canton de Vaud. 

Matiriel linguistique : 10 noms, dont 5 noms frequents connus de I'enfant (avion, 
enfant, indien, oiseau, ourson) et 5 noms rares non connus de I'enfant (ara, ibis, iguane, 
inca, oison). 

Matiriel non linguistique : 20 images representant les noms ci-dessus. Ces images 
sont reparties en deux series : une serie de 10 images representant les noms au singulier 
(exemple : un oiseau), une serie de 10 images representant les noms au pluriel (exemple : 
deux oiseaux). 

Procidure : L'experimentatrice presente une image au sujet et elle prononce le nom 
correspondant h cette image (exemple : voil^ un oiseau.). Elle prend soin de faire la liaison. 
Elle presente ensuite h. I'enfant I'image de I'autre serie qui correspond au meme nom mais 
qui cette fois doit etre emis au pluriel. Elle demande h I'enfant de dire ce qu'il voit sur 
I'image. Elle note s'il emet " deux zoiseaux" ou "deux noiseaux" (maintien errone de la 
liaison). Elle procede de meme en presentant d'abord I'image avec deux oiseaux. 

Analyse des donnies : Pour chaque sujet, nous avons releve le nombre de liaisons 
maintenues en prenant en consideration la fr&iuence du mot. Ensuite, le niveau de langage, 
le niveau d’expression et le niveau de comprehension ont ete evalues subjectivement pour 
chaque sujet sur une echelle allant de 1 ^ 7. Pour ce faire, nous avons demande aux 
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personnes qui cotoient r6guli6rement ces enfants, dans les centres de vie enfantine, 
comment elles situeraient leur niveau de langage par rapport h celui d'autres enfants 
appartenant au meme groupe d'age. Nous avons 6iud\6 I'effet de la frequence du mot sur le 
maintien erron6 de la liaison et nous avons determine le type de correlation qui existe entre 
le nombre de liaisons maintenues et I'age des sujets, leur niveau de langage, leur niveau 
d'expression et leur niveau de comprehension. 

2.2. R^sultats et discussion 

II apparait que le fait que I’enfant connaisse deja ou non le mot propose 
joue un role dans la tendance a maintenir la liaison dans cette epreuve. En 
effet, 24% des liaisons sont maintenues si le mot est frequent et 48% s’il est 
rare (t = 3,88; p < 0,01). II apparait done que la frequence du mot 
propose, autrement dit le fait que I’enfant connaisse deja ou non le mot 
propose, joue un role dans la tendance a maintenir la liaison dans cette 
epreuve. 

Ce resultat nous donne un aper^u de la maniere dont sont stockes les 
mots du lexique chez le jeune enfant. Celui-ci ne considere pas encore la 
liaison comme un phenomene phonologique et morphologique et stocke 
done dans son lexique le mot tel qu’il I’a per^u (e’est a dire sous des 
formes comme "nenfant" ou "zenfant”). Si on se refere aux modeles 
d’organisation du lexique (Fillmore, 1975 ; Aitchison, 1987), les mots 
partageant certaines caracteristiques (meme signification, meme fin) seront 
proches Tun de I’autre dans le lexique. On peut supposer que, peu a peu, 
I’enfant remarque la presence dans son lexique de deux mots 
structurellement proches ("nenfant" et "zenfant"), mots dont la 
signification est la meme. II se rend compte qu’ils sont employes dans des 
contextes phonetiques differents. II restructure alors son lexique en 
ramenant ces deux items lexicaux a une seule entree ("enfant"), qui est la 
forme auditive commune aux deux mots. 

Si on se r^f^re a Aitchison qui compare les mots a des pieces de 
monnaie constitutes de deux faces amovibles, on peut formuler une 
hypothese sur la maniere dont Tenfant reorganise son lexique. II 
detacherait les faces "nenfant" et "zenfant", garderait la signification 
commune et rattacherait cette face "significative" a une nouvelle face 
portant la forme auditive "enfant". II apprendrait la morpho-phonologie de 
la liaison en se rendant compte que ce mot, commen^ant par une voyelle. 
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entre en liaison avec le mot qui le precede, done que sa forme auditive peut 
changer. 

Face aux grandes diff6rences interindividuelles dans la tendance k 
maintenir les liaisons, nous avons cherch6 k 6tablir une corr61ation entre le 
nombre de liaisons maintenues et I'age des sujets. Le r6sultat peu probant 
(coefficient de correlation non-significatif de -0,451) nous a incit6 k 
corr61er le nombre de liaisons maintenues k des facteurs plus linguistiques 
comme le niveau de langage des enfants. II apparait que la tendance au 
maintien erron6 des liaisons d6pend, dans cette 6preuve de "pseudo- 
denomination”, du niveau de langage (r = -0,944), du niveau d'expression 
(r = -0,935) et du niveau de compr6hension du sujet (r = -0,902). 

Cette etude a montr6 que les jeunes enfants, en "pseudo-denomination", 
ont tendance k maintenir de maniere erronee en moyenne 36% des liaisons 
qui leur sont propos6es. Le maintien de ces liaisons est la preuve que les 
sujets qui se comportent de cette fa 9 on ne maitrisent sans doute pas encore 
les regies morpho-phonologiques de la liaison. II revele aussi la forme sous 
laquelle les mots sont stock6s dans le lexique a savoir Texistence pour un 
meme item de plusieurs allomorphes dus k la presence de consonnes de 
liaison diff6rentes. Ces allomorphes disparaitraient progressivement avec 
le d6veloppement du lexique et I'acquisition des regies linguistiques 
relatives a la liaison; chaque item ne possedant alors plus qu'une seule 
entree lexicale. 

3. Repetition a debit lent de phrases comportant des liaisons 
3.1. M^thode 

Sujets : Trois groupes de sujets de langue matemelle frangaise ont ^t^ testes. Groupe 
"adultes" : 10 adultes ag^s de 23 h 48 ans; groupe “5 ans" : 10 enfants ag^s de 5 ^ 5,6 ans, 
scolaris6s en classe enfantine dans le Canton de Vaud; Groupe "8 ans" : 10 enfants ag6s de 
8^9 ans, scolaris6s en fin de deuxifeme ann6e primaire dans le Canton de Vaud. 

Matiriaux : 40 phrases tests divis6es en quatre groupes : 1) liaison entre un article et 
un nom (ex. Un indien arrive), 2) liaison entre un adjectif et un nom (ex. Le petit avion 
pan), 3) liaison entre un pronom de conjugaison et un auxiliaire (ex. Nous avons 6crit) et 
4) liaison entre un auxiliaire et un participe pass6 de verbe (ex. II est arriv6). Les phrases 
sont enregistrdes sur cassette de fagon h. ce que les stimuli soient semblables pour tous les 
sujets. 

Procedure : On enregistre sur cassette les r^ponses du sujet h la consigne qui est la 
suivante : "Tu vas entendre quelqu'un parler. Tu vas redire ce qu'elle a dit. Puis apr^s, tu 
le redis mais moins vite pour que je puisse I'^crire. Par exemple : tu en tends "un cheval 
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galope”, tu redis ”un cheval galope" puis tu le redis mais moins vite "un (pause) cheval 
(pause) galope*’.*’ Le vocabulaire employ^ dans la consigne est l^g^rement modifi^ afin 
d’etre adapts k I’age des sujets de chaque groupe. 

Analyse des donnies : Pour chaque sujet, le pourcentage de liaisons maintenues a 
relev^ en fonction de la nature de la consonne de liaison et de la nature grammaticale des 
deux mots impliqu^s dans la liaison. Nous avons observe pour chaque facteur revolution 
d’un groupe k I’autre et parallel ement nous nous sommes int^ress^s k I’effet d'un facteur k 
I’interieur d’un meme groupe. Des analyses de variances ont r^alis^es dans chaque cas. 



3.2. R^sultats et discussion 

La figure 1 presente le pourcentage de liaisons maintenues, en 
repetition k debit lent, pour chaque groupe d'age. On peut relever un effet 
significatif de groupe : le nombre de liaisons maintenues depend de I'age 
(F (2,27) = 20,36; p < 0,001). La difference est significative entre les 
groupes des 5 ans et des 8 ans ainsi qu’entre les groupes des 5 ans et des 
adultes, mais ne Test pas entre les groupes des 8 ans et des adultes. 




5 ans 8 ans Adultes 



GROUPE 



Figure 1 : Pourcentage de liaisons maintenues 
en fonction du groupe d'age. 
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On peut supposer que dans ce type d’epreuve, les liaisons qui sont 
maintenues sont celles qui sont les plus pregnantes. Nous avons considere le 
groupe des adultes comme groupe controle et lui avons compare les 
r^sultats des groupes d’enfants. Le comportement des enfants ages de 5 ans 
est nettement different de celui des adultes, ce qui confirme les travaux de 
Wijnen (1988). Par contre, nous remarquons que le comportement 
d’enfants ag^s de 8 ans est, dans cette ^preuve, assimilable a celui des 
adultes. Ce qui nous permet d’avancer I’hypothese qu’^ cet age, I’enfant a 
connaissance des regies de la liaison, ^ savoir que dans une 6preuve de 
r6p6tition a debit lent, il maintient les liaisons qu’il produit le plus en 
conversation. 

L’6volution du comportement de I’enfant entre 5 et 8 ans dans cette 
epreuve serait liee au developpement du langage oral et a I’apprentissage 
du langage 6crit qui aideraient a une meilleure maitrise et comprehension 
des regies morpho-phonologiques ayant trait a la liaison. 

La figure 2 presente pour chacune des consonnes de liaison le 
pourcentage de liaisons maintenues par chaque groupe d’age. Nous 
remarquons h. nouveau la relation inverse entre le maintien de la liaison et 
I’age, mais 6galement un effet de consonne. En effet, la nature de la 
consonne de liaison (n, z, t) a un effet sur la tendance a maintenir cette 
liaison a d6bit lent pour le groupe d’enfants de 5 ans (F (2,18) = 17,55; p < 
0,001), pour le groupe d’enfants ages de 8 ans (F ( 2,18) = 24,166; p < 
0,01), ainsi que chez les adultes (F (2,18) = 14,436; p < 0,001). Ces 
r6sultats concordent avec ceux de Mal^cot (1975). 

La figure 3 pr^sente le nombre de liaisons maintenues par chaque 
groupe d’age selon la nature grammatical des mots impliques dans la 
liaison. Pour les trois groupes d’age, on peut mettre en evidence un effet de 
la nature grammaticale des deux mots impliques : (F (3,22) = 23,412; p < 
0,001) pour le groupe des 5 ans ; (F (3,22) = 16,583 ; p < 0,001) pour le 
groupe des 8 ans et (F (3,22) = 13,794; p < 0,001) pour le groupe des 
adultes. Nous observons que chez les groupes des 8 ans et des adultes, les 
liaisons les plus maintenues en repetition a debit lent sont celles qui 
apparaissent entre deux mots tres lies syntaxiquement. 
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Figure 2 : Pourcentage de liaisons maintenues en fonction du groupe d'age, 
pour chaque consonne liaison. 
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Figure 3 : Pourcentage de liaisons maintenues en fonction du groupe d'age, 
selon la fonction grammaticale des mots impliques dans la liaison. 
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La cohesion syntaxique entre les mots serait done un critere qui aurait 
tr^s vite de Timportance dans la production des liaisons. Nous avons 
compart les r6sultats obtenus par les adultes dans Tepreuve de repetition a 
debit lent ^ ceux observes par Mal6cot (1975) dans son etude du langage en 
conversation et avons remarqu6 que les regies qui regissent la production 
des liaisons en conversation sont celles sur lesquelles se basent les sujets 
dans notre 6preuve de r6p6tition ^ d6bit lent. II apparait que certaines de 
ces regies sont appliqu6es tres tot par les enfants et peut-etre meme avant 
qu'ils ne les maitrisent enti^rement. 

4. Conclusion 

Nos 6tudes ont montr6 que les jeunes enfants avaient tendance a 
maintenir plus souvent que les adultes les liaisons qui leur 6taient propos6es 
et que I'apprentissage du langage 6crit jouait un role sur ce maintien. II 
serait int6ressant de pouvoir r6aliser la deuxieme ^tude (repetition a debit 
lent de phrases comportant des liaisons) avec des adultes illettres et de 
comparer leurs reponses a celles d'adultes lettres. II pourrait egalement 
etre interessant de tester des enfants bilingues et de comparer leurs 
reponses a celles de monolingues. En effet, la liaison est un phenomene tres 
frequent en fran^ais mais moins dans d'autres langues. 

Nous pouvons conclure des deux etudes realisees que la liaison n'est 
sans doute pas perdue en tant que telle par le jeune enfant. En fran^ais, il y 
a une tendance h, preferer les structures syllabiques C V (consonne - 
voyelle). II semble logique, puisque oralement on fait la liaison (done on 
recree une structure syllabique CV), que I'enfant per^oive le mot sous cette 
forme et le reproduise ensuite sous la meme forme. 

En ce qui conceme la production de liaisons erronees, nous avons vu 
que le niveau de langage de I'enfant 6tait un bon pr6dicteur de sa tendance 
au maintien erron6 des liaisons dans l'6preuve de "pseudo-denomination". 

II semblerait done que la production de liaisons erronees soit une 6tape 
normale dans le d6veloppement langagier de I'enfant. 
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Choix de langue et alternance codique chez le bilingue en 
situations de communication diverses : ^tude exp^rimentale 

Sonia Weil 

R6sum^ 



Le but de cette experience est de mieux comprendre la perception et la 
production d'^nonc^s bilingues. Des bilingues suisse-allemand/fran^ais ont 
6t6 confrontes k trois interlocuteurs fictifs : un monolingue fran^ais 
comprcnant un peu le suisse-allemand, un bilingue dominant en fran^ais et un 
bilingue equilibr^. Les sujets ont ecoute et retransmis deux histoires en 
suisse-allemand k chacun des auditeurs, Tune ayant un contenu uniquement 
suisse-allemand et I'autre comprenant des code-switchs en fran^ais. 
L'experience a montre que les sujets ont adapts leur langue de base aux 
auditeurs et qu'ils n’h^sitaient pas k traduire les histoires en fran^ais s'ils en 
ressentaient la n6cessit6. Par ce processus, leurs 6nonc6s ont subi des 
influences plus ou moins imponantes de la deuxi^me langue, attribuables k 
certains facteurs qui d^terminent la situation de communication dans laquelle 
se trouve le bilingue. 

1. Introduction 

Les objectifs de cette experience sont d'obtenir des preuves 
experimentales en faveur du continuum de situations de communication 
chez les bilingues, d’6tudier les facteurs qui d6terminent ces situations, 
d’analyser les strategies de production dans les differentes situations et 
d’obtenir des enonces bilingues. 

La question de Fishman (1965), "WHO speaks WHAT language to 
Whom and When?", qui caracterise la situation de communication chez le 
bilingue, servira de fil conducteur dans ce qui suit. 

i) Who? Les principes ci-dessous gouvement notre definition de 
I'individu bilingue : 



- "L’unilinguisme et le bilinguisme ne sont pas des categories 
discretes ; il n’y a pas de cesure entre eux ; il s’agit plutot de 
configurations differentes et variables de facteurs constitutifs de la langue 



O 



98 Choix de langue et alternance codique 



a I’interieur d’un seul et meme continuum. [...] le bilinguisme [...] est une 
manifestation originale de competence et de comportement 
communicatifs.” (Liidi & Py, 1986 : 169) 

- La competence bilingue est le resultat de certains besoins 
socioculturels. Le bilinguisme d’une personne "reflete ce besoin : il sera 
equilibre si le besoin des deux langues est Equivalent (phenomene assez 
rare, d’ailleurs) ; il sera ’dominant’ si une langue est utilisee plus qu’une 
autre” (Grosjean, 1984 : 5). Est done bilingue une personne qui utilise 
rEguliErement deux langues. 

ii) Whom? Notre situation experimentale confronte la personne 
bilingue k trois interlocuteurs dont les competences linguistiques different, 
allant du monolingue k competence passive dans la seconde langue au 
bilingue parfait. 

iii) What language? Les competences linguistiques des interlocuteurs 
ainsi que la situation dEterminent I’emplacement sur le ’’continuum de 
communication” (Grosjean, 1987 : 117), dont les deux extremes sont : 

- La situation de communication monolingue idEale, qui ne connait 
I’utilisation que d’une seule langue. 

- La situation de communication bilingue idEale, qui connait, k un 
degrE d’utilisation Equivalent, I’utilisation de deux langues distinctes (voir 
Grosjean, 1982 : 320s). 

Les situations intermEdiaires sont dEterminEes par la participation de 
mEcanismes des deux extremes. Elies se caractErisent par I’utilisation de 
deux langues, dont I’une, dominante, constitue la langue de base. Le choix 
de la langue de base dEpend de facteurs socioculturels, situationnels, 
fonctionnels et personnels (voir Grosjean, 1982 : 136). Nous partons de 
I’hypothEse qu’il dEpend Egalement du contenu du message, ce que 
Fishman aurait pu dEsigner par ’’about what”. En effet, la compEtence des 
bilingues est souvent spEcialisEe selon les contenus des diffErents contextes 
dans lesquels ils utilisent chaque langue. 
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Les marques transcodiques : Nous s61ectionnerons trois types de 
marques transcodiques dans le corpus : le code-switch, I’emprunt et 
I’interference (le caique, en particulier). 

Le code-switch sera d6fini comme le "passage dynamique d une langue 
a I’autre" (Liidi & Py, 1986 : 146), soumis a certaines contraintes 
linguistiques (cf. Poplack, 1980). II se delimite par rapport h Vemprunt, 
"Element du systeme A [...] insure dans le syst^me B" (Liidi & Py, 1986 : 
146). Les deux sont des manifestations de la communication bilingue. 

Nous d6finissons Vinterference comme la marque d'une interaction 
involontaire entre deux langues, due k la "superposition inconsciente des 
systemes" (Liidi & Py, 1986 : 146), qui apparait surtout en situation 
monolingue. Forme d’interference, le caique est une expression ou une 
construction en langue de base influenc6e par les principes de syntaxe, de 
morphologie ou de formation lexicale de la deuxi^me langue. 

Les strategies exolingues : II s'agit de strategies de ’depannage’ 
employees lorsque les personnes bilingues sont obligees de n’utiliser 
qu’une seule langue. 

iv) When? L'etude experimentale qui suit, appeiee Speech Modes 
Study, est I’adaptation en 1990 d’une etude effectuee k Boston par 
F. Grosjean quelques annees auparavant. 

2. Methode 

Sujets : Les 24 sujets (16 femmes et 8 hommes) avaient entre 20 et 28 ans. La moide 
d'entre eux (nous les designerons par Bi+) se sont estimes "bilingues" dans le sens qu'ils 
ont acquis le frangais pendant leur enfance, dans le cadre familial. Les 12 autres (les Bi-) 
ont pretendu ne pas etre bilingues, partant apparemment de la definition traditionnelle du 
bilinguisme selon laquelle il faut acquerir la seconde langue durant I'enfance et en famille. 
Or, ils n'ont appris le frangais qu'^ partirde I'age de 11 ou 12 ans, k I'ecole. En fait, les 
sujets etaient tous bilingues SA/pl : ils ont dit utiliser regulierement les deux langues et se 
sentir reladvement k I'aise en frangais. Aucun n'a declare etre dominant en fran^ais. 

Mali riel : Les elements de I'experience ont ete preenregistres et combines^. (Duree 
totale : 1 1/4 heure. Appareils : Double cassette Deck RDW266, Sanyo / Walkman DC2, 

‘ SA = suisse-allemand , F = frangais 

2 - Instructions generates // instr. pour la premiere partie / description du premier auditeur 
(2x) / histoire d'essai (3x) / breves instr. / lere hist., bi (3x) / breves instr. / 2eme hist., 
mono (3x) // instr. pour la seconde partie / descr. du deuxieme auditeur (2x) / 3eme hist., 
bi (3x) / breves instr. / 4eme hist., mono (3x) // instr. pour la troisieme partie / descr. du 
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Sony). Comme documents Merits, nous avions les fiches signal^tiques des auditeurs, 7 
feuilles vierges num^rot^es pour la prise de notes, le texte final en fran^ais destine h. la 
lecture ^ haute voix et un questionnaire avec 6chelle de r6ponse de 1 ^7. 

Procedure : Les sujets ont ^t^ confront^s h. trois auditeurs fictifs (Al, A2 et A3)^. Ils 
ont 6cout^ deux fois de suite la description d^tailMe de chacun de ces auditeurs, dont ils 
d^tenaient une fiche signaletique avec photographic. La tache ^tait ensuite de retransmettre 
deux histoires k chacun d'eux (tout en croyant que le but de Texperience etait de 
retransmettre un maximum d'informations). Ils ont 6coui6 chaque histoire 3 fois, prenant 
des notes d^s la seconde ^coute. La premiere des histoires ^tait en langue de base SA avec 
des code-switchs en F (HSA/f) et traitait d’un sujet fran^ais. La deuxi^me histoire ^tait 
uniquement en SA (HSA) et concemait un sujet suisse al^manique (balois). (Racont^es ^ 
la premiere personne par rexperimentatrice, les histoires ont ^te reproduites a la troisieme 
personne.) Une histoire monolingue suppl^mentaire servait d'essai au d^but de 
i’exp^rience. Apr^s avoir racont^ les 6 histoires, les sujets ont lu un texte frangais a haute 
voix. Finalement, ils ont rempli un questionnaire concemant leurs habitudes linguistiques 
et leurs impressions sur I'experience. 

Trois groupes de 8 sujets ont ^t^ ^tablis, constitu^s chacun de 4 Bi+ et 4 Bi-. Les 
auditeurs et les histoires ont ete attribu^s dans un ordre different h chaque groupe4. 

L'exp^rience a eu lieu au domicile de rexperimentatrice, dans un cadre familier. Les 
sujets disposaient des documents Merits, d'un Walkman pour ecouter les enregistrements 
et d’un appareil enregistreur. La dur^e totale de I'experience par sujet etait d'environ deux 
heures. 

Analyse des donnies : Le corpus d'environ 8 heures d'enregistrement a ete soumis 
aux analyses suivantes : 

- decompte des histoires selon la langue de base, 

- transcription partielle des marques transcodiques et des strategies exolingues. 



troisieme auditeur (2x) / Seme hist., bi (3x) / breves instructions / 6eme hist., mono (3x) 

// breves instr. pour lecture du texte final en F. 

^ - Olivier R. (Al) : Parisien, specialiste de grammaire frangaise, responsable de 
I’enseignement du frangais h I’universite de Zurich depuis une annee, de langue matemelle 
frangaise, connaissances rudimentaires du SA, utilise le F avec tout le monde, ne connait 
Bale que par les Etudes frangaises, epouse frangaise. 

- Jean-Claude M. (A2) : Lausannois, specialiste en linguistique theorique, dirige des 
seminaires de linguistique ^ I’universite de Zurich, de langue matemelle fran^aise, parle le 
suisse allemand dans la vie de tous les jours, collogues francophones, ses amis parlent le 
firangais ou le SA, amis balois, epouse lausannoise, parle essentiellement le F ^ la maison 
mais parfois aussi le SA. 

- Bruno S. (A3) : Biennois, sociolinguiste (specialiste du fran^ais en contact avec d’autres 
langues), dirige une etude pour I'universite de Zurich, langue matemelle F, aussi habitue 
au SA qu'au F, utilise les deux langues dans la vie professionnelle et privee, epouse 
baloise, famille et amis ^ Bale (ou il sejoume souvent). 

^groupe 1 : Al : bil/monol A3 : bi2/mono2 A2 : bi3/mono3 

groupe 2 : A3 : bi3/mono3 A2 : bil/monol Al : bi2/mono2 

groupe 3 : A2 : bi2/mono2 Al : bi3/mono3 A3 : bil/monol 

(Les bil, bi2 et bi3 sont les 3 histoires bilingues, designees par HSA/f; les monol, 
mono2 et mono3 sont les trois histoires monolingues, c’est4-dire les HSA.) 
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- calcul du ddbit d’in formation (unites d*information/temps) pour chacune des 144 
histoires, 

- relev6 des marques transcodiques et des strategies exolingues, 

- evaluation des reponses au questionnaire. 

3. Resultats et discussion 

3.]. Choix de langue 

Le Tableau 1 ci-dessous presente le pourcentage de sujets qui ont 
choisi le fran9ais comme langue de base en fonction de I'auditeur et de 
I’histoire. Comme nous pouvons le constater, il existe une relation directe 
entre le type de locuteur et le choix de la langue de base. 





Auditeur A1 


Auditeur A2 


Auditeur A3 


Histoire avec 
code>switchs 
(HSA/f) 


96% 


75% 


25% 


Histoire sans 
code-switchs 
(HSA) 


100% 


71% 


25% 



Tableau 1 : Pourcentage de sujets qui choisissent le fran 9 ais 
comme langue de base en fonction de I'auditeur et de I'histoire 

a) Le fran9ais comme langue de base 

Auditeurs : Les r^ponses quantitatives et verbales aux questions poshes 
aux sujets concemant le choix du fran9aiss confirment Thypothese d'une 



5 Si vous avez choisi le fran 9 ais, pour quelles raisons avez-vous agi ainsi? 

a) L’auditeur ne sait pas assez bien le suisse-allemand pour vous comprendre. 

b) L'auditeur n’aime pas qu'on lui parle en suisse-allemand. 

c) Vous avez assez d’aisance en fran 9 ais pour lui raconter cette histoire. 

d) Autres raisons. 



R^ponses : (sur I'^chelle Pas du tout 12 3 4 5 67 Tout dfait ) : 



a) 


A1 : 


6 


A2: 


3.1 


A3: 


1.5 




b) 


A1 : 


4 


A2: 


2.4 


A3: 


1.5 




c) 

o 

ERIC 


A1 : 


5.2 


A2: 


5.1 


A3: 


4.8 


QC 

tj 
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attitude ’altruiste’ de leur part, tenant compte surtout de la competence, 
mais aussi de la preference de leur auditeur. Toutefois, quatre sujets sur 
onze ont avance des arguments denotant une ambition personnelle de 
prouver leur competence en F (p. ex. "Je parle franfais avec un 
francophone", "Prefere fran 9 ais avec francophones meme si parlent 
allemand"). Ce desir, d'une part, de 'bien faire' envers les auditeurs et, 
d’autre part (plus rarement), de reagir selon certains principes rigides, 
suggere que la situation experimentale a ete interpretee comme une 
situation de communication formellcj ou, faute de possibilite 
d'intervention de I'auditeur, la langue de base n’a pu etre negociee. 

Les sujets qui pretendent toujours parler le fran 9 ais aux francophones 
(alors que dans la vie courante ils ne sont pas fideles a ce principe) se 
trouvent parmi les six sujets qui ont maintenu le F avec A3. Ayant indique 
un taux d'aisance plus 61eve que les autres durant Texperience (5 par 
rapport ^ 4.3), ces 6 sujets pretendent avoir mieux garde a I'esprit leurs 
auditeurs (4.5 par rapport k 3.9) et sont plus surs d'eux quant a 
I’adaptation de leur langue aux auditeurs (6.3 par rapport a 5.7). 

Type d'histoire : Sur les 72 fois ou un sujet s'est adresse a un auditeur, 
il n’y a que deux cas ou I'histoire bilingue est racontee dans une autre 
langue que I’histoire monolingue. Les reponses des sujets sur ce point nous 
portent k croire que les deux sujets en question jugeaient adequat de parler 
en SA ; s’ils ont tout de meme traduit la HSA/f, c'est parce que les termes 
importants y figuraient dej^ en fran 9 ais. 

Nous concluons que le choix de langue de base dans cette situation 
experimentale depend moins du contenu de I'histoire que des competences 
de I’auditeur ainsi que de ses preferences linguistiques. 

b) Le suisse allemand comme langue de base 

L’opinion des sSA^ de leurs auditeurs differe legerement de celle des 
sF^ dans le sens qu'ils ont estime A2 et A3 plus capables de les 
comprendre correctement et plus ouverts au SA. Les reponses au 
questionnaire et le fait qu'il y ait eu peu de commentaires suppiementaires 
demontrent que les sujets n'ont parie en SA que lorsqu’ils etaient 

^ sSA = les sujets qui ont parl6 le SA ; sF = ceux qui ont parl6 le F. 
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parfaitement certains d’etre compris et qu’ils n’ont pas ressenti la n6cessite 
de justifier leur choix. Cependant, trois des rdponses verbales au 
questionnaire sugg&rent que le choix du SA pouvait aussi, pour certains, 
rdsulter du souci d'6viter I’effort de traduire. 

3.2. Transmission des informations 

Chaque histoire entendue contenait un certain nombre d’unites 
d'information^ que les sujets cherchaient a reproduire dans leur totalite. 

a) Histoires retransmises en fran 9 ais 

Les pourcentages d’unites d'information transmises en fonction des 
auditeurs et des histoires sont les suivants : 



A1 : 


HSA/f : 89.56 


HSA : 84.87 


A2 : 


HSA/f : 91.41 


HSA : 86.94 


A3 : 


HSA/f : 92.67 


HSA : 89.67 



Les diff6rences entre les auditeurs ne sont pas significatives, ce qui 
signifie que la preference linguistique de ceux-ci n'a pas d’incidence sur la 
quantit6 d'informations transmises. Quant a la difference entre les deux 
types d’histoires, elle est significative chez A1 (p < 0.05). En supposant 
qu'un plus grand nombre de sujets aurait donn6 des resultats significatifs 
6galement pour A2 et A3, nous postulons que le type d’histoire pourrait 
avoir influence la quantite d’informations transmises. 

II va de soi que le debit des retransmissions (nombre d'unites 
d’information/temps) est plus lent que celui des histoires entendues*. Trois 
observations s’imposent cependant. Premi&rement, le debit augmente 
legferement de A1 a A3, laissant supposer que le r6cit destine a A1 
demandait plus de commentaires. Deuxi&mement, il n’y a pas de 
difference entre les deux types d’histoires, alors que Ton aurait pu 
s'attendre a un d6bit plus rapide dans les HSA/f qui sont plus simples k 



^ Le nombre d’unitds d’information des histoires originales varie entre 25 et 28 (pour une 
dur6e de 1’43 k 1'53). 
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traduire. Troisi^mement, le d6bit des six sujets qui ont parl6 le fran 9 ais k 
A3 est plus rapide que celui des autres sF. 

b) Histoires retransmises en suisse-allemand 

Les pourcentages d'unit^s d'information transmises dans les histoires 
en SA (entre 89% et 91%) ne different pas en fonction des situations de 
communication ni en fonction des deux types d'histoires. De plus, ils ne 
sont pas plus 61ev6s que pour les histoires retransmises en F. (II semblerait 
que les code-switchs dans les HSA/f n'aient pas €t€ mieux m6moris6s que 
les informations donn6es uniquement en SA.) Le d6bit d'information, qui 
se situe entre 5.2 et 6.4 sec. par unit6 d'information, est toutefois 
sensiblement plus rapide en SA. 



3J. Marques transcodiques 



a) Influence du suisse-allemand en fran 9 ais 



La Figure 1 ci-dessous pr6sente le nombre des marques transcodiques 
produites dans les histoires retransmises en fran 9 ais. 

■ CODE-SWITCHS 
H CALQUES 



5 : < 

c« < c« c c« 

X c/3 X X 

< < < 
AUDITEURS ET HISTOIRES 



El EMPRUNTS 




Figure 1. Nombre de marques transcodiques (code-switchs, caiques et emprunts) 
en fonction de Tauditeur (Al, A2, A3) et de Thistoire (HSA/f et HSA). 



8 Dans les histoires entendues, nous trouvons une unite d’information toutes les 4 h 4.5 
secondes. Dans les histoires retransmises, elle apparait toutes les 6.6 ^7.6 second es. 
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Code-switchs : Les differences du nombre de code-switchs d un 
auditeur h I’autre ne sent pas significatives, mais nous postulons qu’elles 
pourraient I’etre avec plus de sujets. Si la progression de A1 k A2 ne 
continue pas chez A3, e’est qu’il s’agit chez ce dernier de la production 
des 6 "puristes”. L’analyse d6taill6e montre qu’ils font g6n6ralement 
moins de code-switchs que les autres sF, mais que leur nombre de code- 
switchs s’accroit de A1 h A3. 

Ce comportement est refl6t6 dans les reponses donn6es aux questions 
"L’auditeur se sert-il de code-switchs ou d’emprunts?" (Al:2.4 / A2:3.4 / 
A3:4.8) et "L’auditeur a-t-il une attitude positive envers le code- 
switching?” (Al:2.5 / A2:3.9 / A3:5.7). Notons que les sujets se basent sur 
la definition des code-switchs et des emprunts comme des "changements de 
langue”. 

Le questionnaire offrait une s6rie de questions concemant les 
habitudes des sujets en matiere de code-switching ainsi que sur les raisons 
du nombre de code-switchs 6mis dans I’experience. Quelques donnees 
ressortent des reponses : 

- Bien que les questions sur le code-switching aient 6i6 r6p6t6es pour 
chacune des 6 histoires, la plupart des sujets n’y ont r6pondu que trois 
fois, consid6rant apparemment leurs reponses valables pour les deux types 
d’histoires. Ainsi, ils semblent ne pas avoir attache d'importance a la 
difference dans le nombre de code-switchs entre les deux types d'histoires. 
Certains d’entre eux ont d’ailleurs exprime la preoccupation de rester 
fideles au texte initial, e'est-a-dire de preserver les termes originaux. 

- Les sujets ont 6te davantage concemes par le fait que I’auditeur 
pourrait ne pas comprendre leurs code-switchs, que par le fait qu'il 
pourrait ne pas les aimer - signe d’une attitude utilitaire. 

- 32 sur 35 sujets ont estim6 avoir fait peu de code-switchs. 

- Les sujets ont soutenu que le code-switching n*6tait pas un 
phenomene courant pour eux (utilisation dans la vie de tous les Jours : 3.3; 
dans le cadre de leurs 6tudes ou de leur vie professionnelle : 2.9; attitude 
gen6rale envers le code-switching et I’emprunt en general : 4). Cependant, 
les taux relativement bas obtenus pour la question sur leur attitude 
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personnelle nous portent a croire a des r^ponses normatives. L’analyse 
selon les types de sujets (les 6 "puristes", les Bi- et les Bi+) d6montre que 
plus les bilingues sont incertains de leurs competences linguistiques, plus 
ils sont ouverts au code-switching. Leur jugement metalinguistique 
s’adapterait done k leur propre competence. 

- Finalement, les rares reponses obtenues sur la situation 
experimentale montrent que celle-ci n’a pas influence la production de 
code-switchs. 

Caiques : Le corpus ne contient que des caiques produits en fran9ais 
dus a I’interference du suisse-allemand. Les HSA/f etant moins difficiles a 
traduire en fran9ais que les HSA, il va de soi qu’elles contiennent moins de 
caiques, eux-memes produits par moins de sujets^. Nous laisserons de cote 
le detail de la nature de ces caiques, repertories selon differents criteres 
syntaxiques (articles, prepositions, concordance des temps, etc.) et 
phonetiques. 

Emprunts : Les emprunts SA en F proviennent exclusivement de mots 
SA deja presents dans les histoires entendues. Ce sont souvent des 
designations officielles d’institutions ou de specialites suisse-aiemaniques. 
Nous supposons que le fait d’emprunter certains mots, e'est-a-dire de les 
integrer phonetiquement et morphologiquement, etait pour les sujets une 
fa90n de camoufler un code-switch. Ceci expliquerait la raison pour 
laquelle le taux d’emprunts chez A1 est legerement plus eieve que chez les 
autres auditeurs (la difference n’etant toutefois pas significative). 

b) Influence du fran9ais en suisse-allemand 

Dans les histoires retransmises en SA, le corpus ne comprend aucun 
caique fran9ais et un seul emprunt. Quant aux code-switchs, etant donne 
qu’ils sont tous repris des histoires HSA/f (a savoir 11% des code-switchs 
originaux chez A2 et 75% chez A3), il existe une forte difference entre les 
deux types d’histoires. D’apres les rares reponses pertinentes donnees dans 
le questionnaire, les sujets auraient repris ces code-switchs pour maintenir 



9 Part des sujets sur le total des sF dont les enonces contiennent des caiques : 



A1 : 


HSA/f: 


22% 


HSA: 


67% 


A2: 


HSA/f: 


11% 


HSA: 


59% 


A3: 


HSA/f: 


33% 


HSA: 


50% 
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le plus d'informations possible et pour les transmettre le plus exactement 
possible ; ce souci d'authenticit6 r6sulte de la difficult^ de rendre les 
HSA/f uniquement en SA. 

3.4, Strategies 

Le corpus contient des exemples de strat6gies telles que la r6p6tition, 
Texplication, la paraphrase ou le commentaire. La plupart d'entre elles 
doivent etre attribu6es aux conditions exp6rimentales (mode oral, absence 
physique de I'auditeur, type d'histoire, etc.). Environ 50% des code- 
switchs SA du corpus fran 9 ais sont accompagn6s de remarques ou 
d'ex plications supplementaires en langue de base : code-switch suivi d'une 
explication sur son contenu ; traduction du code-switch avant sa 
production ; code-switch accompagne d'un commentaire m^talinguistique 
ayant pour fonction de I'excuser, etc. Cela s'explique, entre autres, par le 
fait que le sujet ne connait pas la traduction du code-switch ou que le 
terme est intraduisible (Alber & Oesch-Serra, 1987 : 39). 

Environ la moitie des code-switchs destines a A1 sont en allemand 
standard et non en SA ; chez A3, il n'y en a plus qu'un tiers. L'utilisation 
de I'allemand standard apparait comme une strategie destin6e, d'une part, 
a faciliter la comprehension de I’auditeur et, d'autre part, a 'attenuer un 
code-switch. En effet, ceux-ci concement soit des termes typiquement SA, 
n'existant pas en allemand standard (leur traduction etant done une 
tentative de simplifier la compr6hension), soit des designations officielles 
d’institutions et de notions universitaires. Le fait que les notes prises par 
les sujets et sur lesquelles ils se sont bas6s pour retransmettre les histoires 
aient ete en grande partie r6digees en allemand standard joue certainement 
un role. 

4. Discussion generate 

Plusieurs facteurs expliquent le comportement linguistique des sujets 
dans cette etude : 

a) La personnalite linguistique du locuteur : Nous avons pu regrouper 
les sujets sur la base de leur performance et de leur personnalite. Bien 
qu’il soit difficile de differencier les sujets Bi+ et Bi- sur la base de leur 
production linguistique, il est evident que leur discours metalinguistique 

O 
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les separe : les Bi- ont moins confiance en leur competence et leur 
performance linguistiques, ce qui se manifeste dans un degre de purisme 
moins eleve que chez les Bi+. En outre, le choix de 6 sujets de maintenir 
le fran^ais avec A3 est, en quelque sorte, inapproprie (A3 pr^fererait 
probablement entendre une histoire bien retransmise en SA que traduite 
en F). n n’est cependant pas clair si ce fait doit etre attribue k une certaine 
’arrogance francophile’ ou a I’interpretation inadequate de la tache 
experimentale. De toute evidence, le purisme plus eleve de ces 6 sujets est 
une consequence de leur aisance particuliere en fran^ais. 

b) La personnalite de I’auditeur : La plupart des sujets ont manifeste 
une attitude ’altruiste’ dans le sens qu’ils se sont adaptes k la personnalite 
linguistique des auditeurs (leur competence mais aussi leur attitude), ou du 
moins a la representation qu’ils s’en sont faite. Les trois profils 
d’auditeurs ont en tout cas produit des comportements souvent tres 
diffe rents. 

c) Le contenu du message : Si les particularites linguistiques et 
culturelles des histoires n’ont pas eu I’effet attendu, cela s’explique en 
partie par le fait que la situation experimentale mettait I’accent sur 
I’auditeur, et ainsi ne laissait pas aux sujets la liberty de se concentrer sur 
le contenu. Par contre, celui-ci a eu des repercussions sur le nombre 
d’informations transmises ainsi que sur la nature et le nombre de marques 
transcodiques. 

d) La situation experimentale : Certains resultats montrent que les 
reactions des sujets resultaient parfois d’attitudes figees, ce qui porte a 
croire que la situation experimentale a generalement ete interpretee 
comme une situation de communication formelle. Les raisons probables 
sont I’impossibilite d’une communication directe entre les sujets et les 
auditeurs ainsi que la presence constante de I’experimentatrice. Une 
nouvelle experience devrait envisager un moyen permettant aux sujets de 
prendre contact directement avec les auditeurs, sans que ceux-ci puissent 
toutefois influencer les locuteurs. 

La presente etude fait figure d’experience pilote. Une nouvelle 
recherche de plus grande envergure (avec un nombre plus important de 
sujets) permettrait de confirmer les tendances que nous avons degagees ici. 
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La m^thode verbo-tonale appliqu4e k un groupe 
d’enfants sourds 

Dominique Dubray & V4ronique Kramer 



R4sum^ 



L’objectif principal de cette ^tude est de montrer I'apport possible de la 
m^thode verbo-tonale dans le d^veloppement de la parole d'enfants sourds. 

Nous avons recueilli et analyst les productions de 4 enfants dans le cadre de 
stances de verbo-tonale et les avons compares aux descriptions faites dans la 
litt^rature et h des productions semblables recueillies et analys^es dans une 
situation de r^p^tition “classique”. Les r^sultats montrent que certains 
parametres de la parole semblent b^n^ficier de I'apport de la m^thode alors 
que ce n'est pas le cas pour d'autres. 

1. Introduction 

Qui n’a jamais entendu parler un sourd profond ne peut se rendre 
compte des difficultes que peut provoquer ce handicap a tous les niveaux 
du langage oral. Qui n’a jamais p6n6tr6 dans le monde qui gravite autour 
de la surdite ne peut se rendre compte du nombre et de la complexite des 
moyens et techniques mis en oeuvre pour “apprendre aux sourds a 
parler”! 

Lors de notre travail avec des enfants sourds, I’une des methodes que 
nous avons rencontree, la verbo-tonale, nous a paru particulierement 
digne d’interet car elle comprenait une dimension que les autres, a notre 
sens, ne possedaient pas ; celle de prendre en compte la globalite de 
I’individu. Pour une fois, une m6thode ne se contentait plus d’agir 
exclusivement et d’une maniere artificielle sur un des aspects de la langue, 
mais tentait d ’exploiter chaque canal perceptif de la personne, tout en 
favorisant un apprentissage “en douceur”. 

La methode verbo-tonale est une m6thode favorisant les productions 
orales a I’aide de mouvements corporels, pour I’articulation, et de 
comptines, pour la prosodie. Cette technique donne une importance egale 
aux stimulations visuelles et auditives. Dans la methode verbo-tonale 
creee par Guberina (1956, 1965), on s’attache a realiser dans 
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I’apprentissage du langage I’unite entre le "verbe" (le sens de ce que Ton 
dit) et la ”tonalit6" (la forme audible, comprehensible qu’on emploie pour 
dire). De plus, la methode verbo-tonale tente d’etablir des situations de 
communication r6elles impliquant tous les parametres entrant dans la 
d6finition d’une communication globale : I’ensemble des sons signifiants, 
la participation corporelle a remission de la parole, I’aspect rythmique et 
melodique du langage, en utilisant le plus vite possible un materiel 
signifiant. Cette technique a done pour objectif de rendre I’apprentissage 
du langage par I’enfant malentendant le plus proche possible de 
I’acquisition normale du langage par les entendants. 

La methode comporte certains principes et certaines applications : 
communication globale (la verbo-tonale tient compte de “tous” les 
el6ments d’une situation de communication reelle), role du corps (celui-ci 
sert de macro-mouvement pour amplifier ce qui se passe au niveau des 
organes articulatoires), role de la prosodie (on part du rythme et de 
I’intonation pour arriver aux logatomes, aux mots, aux phrases, etc.), 
developpement des restes auditifs (k I'aide d’un appareillage specifique, 
on tente de faire passer I’audition de tous les sons du langage sur le champ 
optimal de 1’ enfant sourd). 

II est important de prendre un certain recul face a cette methode et 
d’envisager de quelle maniere elle pourrait etre utilisee de fa 9 on 
diff6rente dans une pratique logopedique avec des enfants sourds 
profonds. Le principe de communication globale tel qu’il est defini dans 
la m6thode ne comprend que quelques elements : la relation enfant- 
therapeute, un materiel linguistique signifiant, la prosodie et le role du 
corps. Quant k nous, il nous semble que la notion de communication est 
bien plus large. II s’agit tout d’abord de comprendre pourquoi on 
communique, avec qui, dans quelles situations et selon quelles regies. 
C’est pourquoi nous pensons que la methode verbo-tonale devrait etre 
utilisee dans un contexte de communication ou la langue des signes, 
langue naturelle des sourds, intervient en tout premier lieu en permettant 
k I’enfant d’acquerir cette “competence de communication” dont parle 
Hymes : “En meme temps qu’ils acquierent la connaissance des regies de 
la langue, les enfants apprennent aussi les conditions d’utilisation des 
phrases” (De Pietro, 1990). 
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De plus, il s’agit d’une situation d’imitation, de repetition de sons, de 
mots ou de phrases accompagnes de gestes et int^gr^s ou non dans des 
rythmes musicaux. Peut-on parler dans ce cas de situation de 
communication reelle ? Y a-t-il ^change veritable ? Ainsi, bien que cela 
ne soit pas notre propos dans ce travail, il nous a paru utile de pr^ciser 
dans quelle optique cette m6thode nous a interessees : il ne s’agit pas ici 
pour nous de parler de la methode verbo-tonale en terme de demutisation 
et dans une perspective oraliste (ce qu’a I’origine semble preconiser 
Guberina et ce que font encore de nombreux praticiens). Nous 
envisageons au contraire son utilisation dans un contexte bilingue ou la 
communication, quelle que soit la langue (LSF ou langue orale), est 
primordiale et est consider6e comme I’acquisition la plus importante que 
doit faire I’enfant. Ainsi, nous envisageons I’utilisation de la verbo-tonale 
non pas comme une “methode” mais comme un moyen parmi d’autres de 
faciliter la production orale des enfants sourds. 

L’objectif principal de notre etude* est de montrer certains apports 
possibles de la methode verbo-tonale dans le developpement de la parole 
d’enfants sourds. Pour ce faire, nous avons recueilli et analyst leurs 
productions dans le cadre de seances de verbo-tonale et les avons 
comparees aux descriptions faites dans la litterature et a des productions 
semblables recueillies et analysees dans une situation de repetition 
“classique”. 

Dans toutes les analyses que nous avons effectuees, nous avons situe 
les enfants par rapport a une norme (representee suivant les cas par la 
logopediste ou des enfants entendants), ce qui nous a permis d’effectuer 
deux types de comparaison : a) entre les resultats obtenus en situation de 
verbo-tonale et les descriptions foumies par la litterature, et b) entre les 
resultats du niveau segmental obtenus en situation de verbo-tonale et en 
dehors. 



* Bas6e sur un travail de mdmoire d'orthophonie (Dubray & Kramer, 1991). 
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2. La parole en situation de verbo-tonale 
2.1. M6thode 

Sujets : Nous avons observe un groupe de quatre enfants ayant tous une surdit6 de 
perception (trois sourds profonds et un sourd s6v^re k profond) qui, bien qu’ils ne soient 
pas du meme age, font tous partie de la meme classe de I’Ecole Cantonale pour Enfants 
Sourds du Canton de Vaud (niveau deuxi^me enfantine/premi^re primaire). 

Matiriel linguistique : A partir de cinq phonemes (/p, b, a, i, u/), nous avons 61abor6 
six comptines nous permettant d’observer k la fois 1’ articulation et la prosodie. Ces 
comptines ont toutes la meme structure : CV CV* ; VCV CV* ; CVCV CV* (C = 
consonne ; V = premiere voyelle ; V* = deuxi^me voyelle). Void un exemple : /pa pi/ ; 
/apa pi/ ; /papa pi/ ; la pipe. 

Procedure : Nous avons enregistr6 les enfants sourds pendant des seances de verbo- 
tonale qui se deroulaient quasiment normalement si ce n’est que le materiel linguistique 
etait s61ectionn6 en fonction de notre recherche. Puis, la logopediste donnait aux enfants 
un modde de comptine qu’ils repetaient une ou deux fois tous ensemble. Ensuite, chaque 
enfant s6par6ment reprenait la comptine qui 6tait alors enregistree. 

Analyse des donnies : Au niveau supra-segmental, nous avons observe pour chaque 
comptine les variables temporelles suivantes : le debit (la vitesse d’elocution en tenant 
compte du temps de pause) ; la vitesse d ’articulation (la vitesse d’elocution sans tenir 
compte du temps de pause) ; les pauses (les silences dans la chaine parl6e) ; le temps 
d’ articulation et le temps de pause (exprim6s en pourcentage) ; le rythme (la repartition 
des temps de parole et des temps de pause dans le temps). Nous avons egalement etudi6 
rintonation en mesurant la variation de la hauteur de la voix obtenue grace aux mesures 
de la frequence fondamentale et de ses variations ainsi qu’k la direction que prend celle-ci 
dans la suite sonore (mont6e - stabilite - descente). Enfin, au niveau segmental, pour 
chaque consonne, nous avons observe la duree et la presence ou 1’ absence d’un 
pr6voisement. Pour chaque voyelle, nous avons calculi la dur6e et 1’ amplitude des 
harmoniques. 

Analyses statistiques : Pour toutes ces donn6es, nous avons effectu6 diff6rentes 
analyses statistiques afin de constater s’il existait des differences entre les resultats de la 
logopediste et ceux des enfants, et entre les resultats des enfants les uns par rapport aux 
autres. 
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2.2. R^sultats et discussion 

Niveau supra-segmental : La Figure 1 ci-dessous presente le rythme 
(repartition du temps d’articulation et du temps de pause) des quatre 
enfants (E) et de la logopediste (A)2. Nous observons qu’il est beaucoup 
plus saccade chez les enfants sourds que chez I’adulte, ce qui est du au 
nombre de pauses plus eleve. Pour les enfants, le geste et la parole 
forment un tout dirige par le geste : lorsqu’ils arretent un mouvement, ils 
arretent de parler. Etant donn6 qu’un geste correspond a une syllabe, les 
enfants s’arretent apres chaque syllabe. D’autres explications seraient liees 
aux 6ventuels problemes de memorisation des enfants ou aux problemes 
de respiration et de la tenue du souffle. La litterature decrit le rythme 
d’enfants sourds comme anormal, irregulier et lent. Celui trouve ici est 
egalement anormal mais on ne peut pas le qualifier d’irregulier ou lent. 
Nos resultats semblent done montrer un apport de la methode verbo- 
tonale a ce niveau. 




A El E2 E3 E4 



SUJETS 

Figure 1 : Le rythme des sujets base sur la repartition temporelle du 
temps d'articulation (TA) et du temps de pause (TP) en pourcentages. 
Chaque zone noire represente le temps d'articulation (6 mesures en 
moyenne) et chaque zone blanche represente le temps de pause (6 
mesures en moyenne). 



2 Dans les figures presentees, A = adulte-logopediste, E = enfants. 
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En ce qui conceme I'intonation, nous savons d'apres la litterature que 
les sourds ont en general une variation de la frequence fondamentale 
beaucoup plus elevee que la norme. Or, nous n'avons pas retrouve ce 
phenom^ne dans notre 6tude. La Figure 2 ci-dessous presente l'6cart-type 
de la frequence fondamentale (en Hertz) des quatre enfants (E) et de la 
logop^diste (A). Nous constatons une variation egale, voire inferieure, a 
celle du modele, ce qui est confirme par une analyse statistique. Ce 
parametre semble done etre bien maitrise par ces enfants. 




A El E2 E3 E4 



SUJETS 

Figure 2 : L'^cart type de la frequence fondamentale (en Hertz) des sujets. 
Chaque colonne repr^sente la moyenne de 6 ecarts types. 



Un autre resultat nous parait interessant : contrairement a I’idee 
rdpandue que les sourds ont une intonation monotone, nous avons observe 
que trois enfants sur quatre presentaient une frequence fondamentale 
varide avec des montees, des descentes et des etats stables (voir la Figure 
3, page suivante). II serai t done possible que dans un contexte tel que le 
propose la methode verbo-tonale, les enfants soient plus sensibilises aux 
variations de la mdlodie. Ceci d’autant plus que la litterature remarque 
une tendance aux montdes, alors que la majorite des enfants que nous 
avons observes dans cette etude tendent a produire des intonations 
descendantes en fin d’6nonc6. 
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SUJETS 

Figure 3 : La direction de la frequence fondamentale (en pourcentages) dans 
les comptines des sujets : mont^e (+), stability (=), descente (-). Les 
moyennes ont effectu^es sur 48 mesures pour les enfants et 1 8 pour la 
logopddiste. 



Niveau segmental : Contrairement a la litt^rature qui d^crit une confusion 
sourdes / sonores pour les consonnes, nos r^sultats montrent que trois 
enfants sur quatre pr6voisent plus le M que le /p/ (voir Figure 4, page 
suivante) et que tous 6mettent le /b/ avec une dur^e plus longue que le /p/ 
(voir Figure 5, page suivante). 

Pour ce qui est des voyelles, elles dont d^crites comme etant souvent 
emises avec conformit6, ce qui nuit a leur identification. Or, les 
mouvements des formants des voyelles sont particulierement importants 
pour que I’auditeur puisse percevoir les voyelles elles-memes ainsi que les 
consonnes adjacentes. Mais, chez les sourds, ces formants sont peu ou mal 
differencies. Certains auteurs (ex.: Monsen, 1983) I’expliquent par le fait 
que le placement de la langue, essentiel pour la production des formants, 
n’est pas visible et done difficilement per 9 u par le sourd. Dans notre 
etude, aucune tendance ne se d6gageait clairement, chaque enfant se 
comportant differemment selon les situations. 
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H /p/ en VT 
M /b/ en VT 



% 



A 



El E2 E3 E4 



SUJETS 

Figure 4 : Le prdvoisement (en pourcentages) des consonnes /p/ et /b/ 
pendant les seances de verbo-tonale (VT). Chaque colonne repose en 
moyenne sur 18 mesures. 





Figure 5 : La duree (en millisecondes) des consonnes /p/ et /b/ pendant les 



stances de verbo-ton^e 
mesures. J 



fg' 



Chaque colonne repose en moyenne sur 1 8 
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3. La parole hors situation de verbo-tonale 

3.1. M^thode 

Sujets : Ce sont les memes sujets que dans la situation en verbo-tonale. Nous avons 
en plus enregistr^ deux enfants entendants (une fille et un gar 9 on) ne pr^sentant pas de 
troubles logop^diques afin de pouvoir comparer les spectres des enfants sourds k une 
norme. 

Matiriel linguistique : Com me cela n’avait pas de sens de produire la comptine sans 
les gestes, puisque pour les enfants cela forme un tout, nous nous sommes limit^es k la 
comparaison de I’articulation segmental et n’avons pas tenu compte de la prosodie. En 
fait, nous avons repris les premiers ^l^ments de chaque comptine avec la structure 
suivante : CW/WCW/CWCW (ex. : /pa - apa - papa/). 

Procedure : Nous avons enregistr^ les enfants sourds munis de leurs contours 
d’oreille lors de stances individuelles. La logop^diste se trouvait face k I’enfant et 
produisait, en I’accompagnant des gestes du LPC (Langage Parl^ Compl^t^ : m^thode 
d’aide k la lecture labiale), un des logatomes (ex.:/apa/) que I’enfant r^p^tait 
imm^diatement le mieux possible. La meme proc^ure a ^t^ utilis^e avec chacun des 
logatomes que nous avions s^lectionn^s. Pour les enfants entendants, il s’agissait d’une 
situation de r^p^tition “classique” (sans LPC) ou nous ^tions nous-memes le module k 
imiter. 

Analyse des donnies : Au niveau segmental, nous avons effectu^ des analyses 
acoustiques identiques k celles de la situation en verbo-tonale. Les memes tests 
statistiques ont ^t^ utilises. La seule difference reside dans le fait que les harmoniques des 
sujets sourds et de la logop6diste ont 6i6 correiees avec celles des enfants entendants. 

3.2. R^sultats et discussion 

Au niveau de la duree du prevoisement des consonnes ainsi que de 
leur dur6e totale, si nous comparons les productions hors verbo-tonale 
(Figures 6 et 7, page suivante) avec celles en verbo-tonale (Figure 4 et 5, 
page precedente), nous remarquons que les consonnes durent plus 
longtemps en situation de verbo-tonale qu’en dehors. En situation de 
verbo-tonale, le rapport entre le prevoisement des consonnes et leur 
duree est visible (Figures 4 et 5), ce qui n’est pas le cas hors verbo-tonale 
(Figure 6 et 7) pour trois enfants (E2, E3 et E4). On peut en conclure 
que le voisement dure beaucoup moins longtemps dans la situation hors 
verbo-tonale. Nous faisons I’hypothese que cela est du aux gestes qui 
accompagnent les productions en verbo-tonale : en effet, le mouvement 
du /b/ est tr^s different et dure plus longtemps que celui du /p/, ce qui 
incite a un prevoisement plus long. C’est pourquoi I’hypothese d’une aide 
reelle apportee par les gestes peut etre avanc6e. 




117 



122 La mithode verbo-tonale 



100 

90 

80 

70 

60 

% 50 

40 
30 
20 
1 0 
0 




A El E2 



E3 



B /p/ hors VT 
^ /b/ hors VT 




SUJETS 

Figure 6 : Le prevoisement (en pourcentages) des consonnes /p/ et /b/ 
hors situation de verbo-tonale (VT). Chaque colonne repose en 
moyenne sur 12 mesures. 
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Figure 7 : La dur^e (en millisecondes) des consonnes /p/ et /b/ hors 
situation de verbo-tonale (VT). Chaque colonne repose en moyenne sur 
12 mesures. 
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A propos de la qualite des voyelles, nous ne trouvons pas de 
comportements constants en et hors situation de verbo-tonale hormis le /i/ 
qui est meilleur en verbo-tonale. On peut formuler I’hypothese que le 
geste du /i/, qui est d’ailleurs tres precis et specifique, aide les enfants 
dans leurs realisations. On observe cependant Tinverse dans les 
productions du /a/. Cela peut s’expliquer par le fait que le geste du /a/ est 
peu diff6rencie de ceux du /e/, du /e /, du /o/ et du /b/, ce qui pourrait 
provoquer une certaine confusion dans la production des enfants. Enfin, 
le /u/ est produit de maniere equivalente en et hors verbo-tonale, ce qui 
ne nous permet pas de tirer quelque conclusion que ce soit par rapport a 
une 6ventuelle aide des gestes. Afin d'illustrer les resultats obtenus dans 
I'analyse des voyelles, nous pr6sentons dans la Figure 8, page suivante, le 
/i/ produit par I’adulte et par I'enfant E3 en et hors verbo-tonale. 

4. Conclusion 

Bien que les resultats obtenus portent sur un petit nombre de sujets 
sourds, nous pouvons penser que les gestes de la verbo-tonale sont 
susceptibles d’apporter une aide reelle a la production des phonemes, mais 
a certaines conditions : 

- II faut que ces gestes soient extremement bien differencies les uns 
des autres et qu’ils representent le plus possible les mouvements des 
organes phonatoires. Par consequent, en ce qui conceme les phonemes 
6tudi6s ici, le geste du /p/, du /b/ et du /i/ semblent etre tout a fait 
adequats : en effet, celui du /p/ met bien en evidence I’explosion et la 
brievete de ce phoneme, celui du /b/ (beaucoup plus long que celui du /p/) 
favorise le voisement de cette consonne, et celui du /i/ souligne 
parfaitement la tension contenue dans cette voyelle. Le geste du /a/, par 
contre, semble devoir etre ameliore afin d’etre associe plus 
sp6cifiquement a ce phoneme et a lui seul. Enfin, nous ne pouvons tirer 
par cette 6tude aucune conclusion quant au mouvement du /u/. 

- L’enfant doit posseder la capacite de se concentrer a la fois sur le 
geste et sur la parole. Par consequent, cette methode serait a envisager 
avec prudence dans les cas de certains deficits intellectuels, moteurs, etc. 

Au niveau supra-segmental, on peut penser que I’utilisation de 
comptines constitue une bonne sensibilisation a la prosodie de la parole. 
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en particulier en ce qui conceme Tintonation. Cependant, les gestes 
semblent avoir pour consequence des cassures dans le rythme produit par 
les enfants et un ralentissement du debit. Cela peut etre du a la forme des 
gestes qui sont, dans notre experience, 6troitement lies a chaque syllabe. 

Comme nous restons persuad^es que tous ces enfants s’aident 
6norm6ment du canal visuel pour percevoir le phenomene de la parole, 
nous pensons qu’il est important de persister dans cette voie, tout en 
modifiant les gestes utilises et en les rendant plus globaux. A notre avis, il 
serait plus approprie d’utiliser des mouvements de type balancements, 
d^placements du corps entier dans I’espace, mouvements souples de la 
main soulignant la prosodie (un peu comme un chef d’orchestre), etc., 
sans arreter le geste, tout en continuant la phonation et sans plus se 
rattacher d’aucune fa 9 on aux syllabes produites. 

Remarquons egalement que les quatre enfants observes dans ce 
m^moire ont enormement de plaisir a “venir a la verbo-tonale”, ce qui est 
un point tout a fait positif quant a I’utilisation de cette methode avec des 
enfants sourds. II faut cependant preciser qu’ils ont encore plus de plaisir 
lorsque les seances se transforment en seances de jeux (jeu de I’oie, etc.) 
integrant les gestes de la verbo-tonale. Ils trouvent ainsi une motivation a 
parler et a retenir les mots prononces. Cela peut etre un indice 
encourageant pour notre maniere d’envisager I’utilisation de cette 
methode dans un contexte de communication ou la relation a autrui et la 
notion de plaisir jouent un role important. 

En r6sum6, a la lumiere des resultats que nous avons obtenus, il nous 
parait que, aussi b^nefique et plaisante que puisse etre la m6thode verbo- 
tonale, elle ne devrait pas etre utilisee syst^matiquement avec tous les 
enfants sourds et en tout cas pas comme technique unique pour 
I’apprentissage de I’oral. 
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Prediction et perception de la prosodie 
Chez des sujets cerebro-ieses 

Cendrine Hirt 



Resume 

La prosodie, integree aux indices phonetiques, syntaxiques et 
semantiques, joue un role considerable dans la perception de la parole. La 
localisation c^rebrale du traitement de la prosodie fait Tobjet de divergences 
quant k la participation de Tun ou I'autre des hemispheres. Vingt sujets 
cerebro-ieses (gauches et droits) et vingt sujets noimaux doivent estimer la 
longueur d'une phrase dont le debut est presente auditivement. Pour effectuer 
cette prediction, seule la prosodie est pertinente pour I'auditeur. Les lesions 
gauches, qui se component comme les noimaux, per^oivent la distinction entre 
une phrase qui se termine et une phrase qui se poursuit mais ne differencient 
pas les phrases qui continuent entre elles. A I’oppose, les lesions droites se 
distinguent des noimaux en identifiant mal les phrases qui se terminent et en 
sous-estimant les autres. Ces resultats parlent en faveur d’un traitement 
hemispherique droit de la prosodie linguistique bien que les stimuli soient 
integres dans un environnement linguistique. 

1. Introduction 

De nombreuses etudes ddmontrent que les auditeurs ont frequemment 
recours aux informations prosodiques contenues dans un dnoncd lors de 
I’analyse de la parole. La prosodie constitue k la fois une aide efficace 
pour le locuteur lorsque celui-ci transmet un message et une valeur 
informative considerable pour I’auditeur dans la comprehension de ce 
meme message. II apparait egalement que la prediction, consideree 
comme une activite indispensable et omnipresente dans la perception de la 
parole, entretient des relations etroites avec la prosodie qui constitue 
parfois la seule source d’informations disponible pour I'auditeur. La 
prosodie joue, par consequent, un role non seulement lorsqu’elle est 
perdue simultanement aux autres informations linguistiques mais aussi 
lorsqu’elle annonce les evenements langagiers a venir dans le discours. 

Afin de mieux comprendre les performances des sujets cerebro-ieses 
dans une tache de prediction de longueur de phrase, nous devons 
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rapidement evoquer les conclusions d’une premiere etude realisee avec 
des sujets normaux francophones (Hirt, 1991), elle-meme inspiree de 
l’6tude de Grosjean (1983). Nous avons en effet observe que les auditeurs 
francophones reconnaissent la prosodie typique d’une fin de phrase alors 
qu’ils ne parviennent pas a distinguer les differentes phrases qui se 
continuent. Ces observations contrastent avec celles des sujets anglophones 
de Grosjean (1983) qui pouvaient estimer correctement la duree des 
phrases se terminant ou se poursuivant de 3 et 6 mots. Nos donnees 
peuvent etre expliquees par une analyse acoustique des stimuli ; en effet, 
il existe d’importants changements acoustiques entre les phrases terminees 
et les phrases interrompues qui peuvent etre pergus et correctement 
interpretes par les auditeurs. Toutefois, en fran 9 ais, les informations 
acoustiques contenues dans les phrases qui se poursuivent sont peu 
variables d’une terminaison a I’autre et ne permettent pas, par consequent, 
de les distinguer precisement les unes des autres. Nous avons egalement 
releve que les sujets francophones parviennent a predire la longueur de la 
phrase avant meme qu’elle soit presentee dans sa totalite (avec precision a 
partir de 75% du dernier mot entendu). Ainsi, on peut conclure qu’un 
enonc6 vehicule des informations prosodiques auxquelles I’auditeur 
recourt a certaines etapes du traitement de la parole ; de plus, il apparait 
que la prosodie elle-meme contient des informations sur la duree des 
phrases. 

Dans le domaine de la lateralisation de la prosodie, Behrens (1985), 
Blumstein & Cooper (1974) et Shipley-Brown & coll. (1988), qui ont 
tous effectue des 6tudes avec des sujets normaux, s’accordent sur le fait 
qu’il y a une participation de I’hemisphere droit dans le traitement de la 
prosodie linguistique. Cette contribution semble etre, par ailleurs, plus 
active lorsque le contenu linguistique des stimuli est reduit voire absent. Il 
subsiste, cependant, une divergence quant a I’influence et a la presence 
d’un contexte linguistique (tel que dans des taches d’identification 
d’accents lexicaux ou de types de phrases) qui pourrait etre a I’origine 
d’une intervention secondaire de I’hemi sphere gauche. 

Certaines observations recueillies aupres de sujets cerebro-leses 
confirment ces premieres donnees. Blumstein & Goodglass (1972) 
demontrent que la perception des accents en anglais est preservee chez les 
aphasiques, meme en presence de troubles de la comprehension auditivo- 
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verbale ; la reconnaissance de ces accents et I’application des regies 
grammaticales qui leur sont relatives ne semblent pas affectees par une 
lesion gauche. Green & Boiler (1974) constatent egalement que les 
aphasiques ont conserve la capacity de distinguer et de reconnaitre 
diff6 rents types de phrases (ordre, question, etc...). Dans une perspective 
oppos6e, Baum & coll. (1982) remarquent que les aphasiques de Broca 
r6ussissent moins bien que les sujets normaux la tache de perception 
d’accents pour desambiguiser des phrases phon^tiquement semblables. 
Pour eux, la comprehension orale mediatis6e par les informations 
prosodiques serait perturb^e chez les aphasiques. Dans I'etude 
d’Emmorey (1987), utilisant le meme type de stimuli que Blumstein & 
Goodglass (1972) mais inclus dans un contexte phrastique, les aphasiques 
ont de faibles performances liees, selon I'auteur, aux modifications 
apportees a la tache devenue ainsi plus sensible aux capacites de 
perception des sujets. Elle postule alors que la comprehension de paires 
d’homophones accentu6s, alterde en presence d'une 16sion gauche, serait 
conserv6e en cas d’atteinte h6misph6rique droite. L'h6misphere gauche 
serait impliqu6 dans la comprehension de la prosodie lexicale (I'accent 
etant un element situ6 entre la syllabe et la suite de mots) alors que 
rh6misphere droit analyserait les contours prosodiques en tant qu'unit6s 
holistiques. Toutefois, nous pouvons 6voquer la nature de la tache 
exp6rimentale comme cause de ces r6sultats : en effet, Timportance du 
contexte linguistique pourrait constituer pour les aphasiques un obstacle 
suppl6mentaire dans I'execution de la tache pour laquelle ils ne peuvent 
pas uniquement se baser sur la prosodie. Dans ces deux demieres 6tudes, 
soulignons que la prosodie est fortement ancr6e dans un contexte verbal 
qui pourrait interferer avec la perception des parametres acoustiques et 
expliquer ainsi une participation, meme secondaire, de Themisphere 
gauche. 

Weintraub & coll. (1981) demontrent que les lesions droites different 
des sujets normaux dans leur capacity h distinguer les indices prosodiques 
(accents lexicaux ou d’insistance) foumis par les informations phonetiques 
de la parole. Lonie & Lesser (1983) ne mettent en Evidence aucune 
difference entre les performances des lesions droites et gauches 
(inferieures aux sujets normaux) dans une tache de discrimination et 
d’identification de types de phrases. Heilman & coll. (1984) obtiennent de 



1 32 Prediction et perception de la prosodie 



memes r6sultats en presentant differents types de phrases filtrees (contenu 
s6mantique inintelligible mais prosodie intacte), a savoir que les deux 
groupes, qui ne different pas, pr6sentent une comprehension de la 
prosodie linguistique perturbee. Selon ces auteurs, Themisphere droit 
serait dominant uniquement dans le traitement de la prosodie 
6motionnelle. Ils 6mettent I’hypothese que le traitement de la prosodie 
linguistique serait represente bilateralement ; ainsi, une lesion de Tun des 
hemispheres interromprait partiellement I'analyse de I'information. La 
comprehension deficitaire des lesions gauches pourrait etre attribuee a la 
demande linguistique de la tache plus qu'a un deficit prosodique sous- 
jacent, la prosodie jouant parfois le role de marqueur syntaxique. 

Buttet Sovilla (1988) demontre le role de la prosodie dans la 
compr6hension des relations syntaxiques d*une phrase en presentant des 
enonces dont I’intonation est en interaction ou non avec la syntaxe. Les 
sujets avec lesion droite sans dysfonctionnement de la region temporo- 
pari6tale per 9 oivent mieux les phrases avec intonation normale et sont, 
par consequent, sensibles au conflit cree entre Tintonation et la syntaxe. 
Par contre, chez les sujets avec dysfonctionnement temporo-parietal, il 
n'existe aucune difference significative entre les phrases avec intonation 
adequate ou anormale. Pour Buttet Sovilla (1988), il existerait, pour la 
prosodie linguistique, un continuum entre un pole propositionnel et un 
pole automatique et un continuum entre le fonctionnement hemispherique 
gauche et droit. Le traitement des parametres acoustiques presents a 
I’endroit d'une frontiere syntaxique majeure se reclamerait a la fois d'un 
precede global (automatique) et analytique (propositionnel) et 
necessiterait une participation bihemispherique pour un fonctionnement 
optimum. Bryan (1989) conclut egalement a un desordre prosodique de 
nature linguistique specifique aux lesions droites ; les patients avec une 
atteinte temporale droite font plus d’erreurs aux tests de discrimination, 
alors que ceux avec une 16sion parietale droite se montrent moins 
performants aux tests d'identification de la prosodie. Dans certaines 
taches telles que I'identification d’accents lexicaux dans une phrase, il est 
probable que les deux hemispheres soient impliques, les sujets devant 
recourir non seulement aux indices prosodiques mais aussi aux el6ments 
linguistiques contenus dans les stimuli. 
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On retrouve ainsi la meme controverse quant a la contribution 
hemisph^rique au traitement de la prosodic linguistique, divergence qui 
s'articule toujours autour de I'influence du caractere linguistique de la 
tache qui pourrait impliquer rh6misphere gauche, II apparait que dans les 
taches tr^s verbales (Baum & coll. (1982) ; Emmorey (1987) ; Heilman & 
coll. (1984)), les aphasiques d6montrent de faibles performances 
(resultats que nous pourrions interpr6ter comme etant dus aux troubles de 
la compr6hension des 616ments verbaux contenus dans les stimuli). Par 
contre, Blumstein & Goodglass (1972), Bryan (1989), Buttet Sovilla 
(1988), Green & Boiler (1974), Heilman & coll, (1984), Lonie & Lesser 
(1983), Weintraub & coll. (1981) confirment I’importance d’un 
traitement h6misph6rique droit et envisagent I’analyse de la prosodic 
linguistique comme une participation bilaterale, en particulier pour les 
taches dans lesquelles I'environnement linguistique remplit une fonction 
utile pour I’auditeur parallelement aux informations prosodiques. 

La majorit6 des travaux cit6s portent sur le traitement de la prosodic 
en temps r6el, au moment meme oCi le locuteur parle, et non sur les 
capacites de prediction. Par ailleurs, ces etudes proposent des taches de 
meme nature : soit les informations prosodiques sont isol6es par 
suppression des contenus phon6tique et semantique des stimuli au moyen 
d'un filtrage (situation artificielle car elle ne reflete pas la parole 
naturelle), soit la prosodic est maintenue dans son contexte verbal mais 
dans ce cas la demande parfois trop linguistique de la tache interfere avec 
la perception de la prosodic. Contrairement a ces dtudes, dans la tache de 
pr6diction que nous allons utiliser, le sujet se trouve dans une situation de 
parole ’’naturelle” dans laquelle I’interaction entre les informations 
phon6tiques, syntaxiques, s6mantiques et prosodiques est respect6e et la 
prosodic conservee dans un environnement linguistique sans que celui-ci 
ait d’influence sur l'interpr6tation des indices prosodiques et sur la 
lat6ralisation c6r6brale de leur traitement. 



Nos objectifs principaux sont de d6finir les capacites de pr6diction et 
de perception de la prosodic linguistique des sujets cerebro-16ses et de 
mettre en dvidence des comportements differents entre les Idsions gauches 
et droites. Nous formulons I’hypothese que, malgrd la fonction 
linguistique remplie par la prosodic dans cette tache (a savoir, indiquer la 
fin ou la continuation d'une phrase), les lesions droites devraient 
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d^montrer des performances plus faibles que les sujets normaux, 
postulant que le deficit prosodique cause par une atteinte hemispherique 
droite est probablement global et ne se limite pas uniquement a la 
prosodie 6motionnelle. Au contraire, les lesions gauches devraient r^ussir 
cette tache de fa 9 on comparable aux sujets normaux et obtenir de 
meilleurs r^sultats que les lesions droites malgr6 la presence de troubles 
de la comprehension auditivo-verbale. II a demontre que la presence 
d'un environnement linguistique dans lequel apparaissent les stimuli 
influence la perception de la prosodie et peut parfois etre a I'origine 
d’une contribution bihemispherique. Etant donne que les contenus 
phonetiques, syntaxiques et semantiques des stimuli ne jouent aucun role 
dans notre tache et ne sont pas informatifs pour Tauditeur, les lesions 
gauches ne devraient pas, par consequent, rencontrer de difficultes. 
Toutefois, la presence d'un contexte linguistique a elle seule suffit-elle a 
provoquer I’intervention de I'hemisphere gauche dans le traitement ou 
est-il n^cessaire que ce meme contexte remplisse une fonction reellement 
utile pour I’auditeur ? 

2.Methode 

Sujets : 20 sujets droi tiers, francophones, prdsentant une lesion cer^brale unilat^rale 
d'origine vasculaire (10 Idsions gauches avec aphasie et 10 lesions droites) sans trouble 
auditif. Chacun d’eux a beneficie d'un examen neuropsychologique dans la Division de 
Neuropsychologie du CHUV/Lausanne qui a permis de ddfinir le type d'aphasie et les 
troubles associes. La moyenne d'age des patients atteint 55 ans (55,8 ans pour les lesions 
gauches et 54,2 ans pour les Idsions droites). 

20 sujets-controles droitiers, francophones, sans atteinte cerebrate ou signes 
d'affaiblissement intellectuel ni surditd, apparids aux sujets cdrdbro-leses pour I'age et le 
sexe. La moyenne d'age des sujets-controles atteint 54,6 ans. 

Matiriel : Le matdriel, intitule "Test de perception de la durde de phrases", a etd 
extrait de notre premiere dtude rdalisde avec des sujets normaux (Hirt, 1991), elle-meme 
adaptde de la version anglophone de Grosjean (1983). Le test comprend 24 phrases 
r^parties en 3 categories con tenant chacune 8 phrases diffdrentes. Le premier type (appeie 
terminaison 0) est constitud d’une phrase declarative simple (complement circonstanciel- 
sujet-verbe transitif-compldment d’objet direct). 

Exemple : Ce matin, le facteur a laissi sa bicyclette. 

Le deuxi^me type de phrases (terminaison 3) est identique au prdcddent, exceptd 
qu'il se prolonge d’un segment de 3 syllabes formant une phrase prepositionnelle. 

Ce matin, le facteur a laissi sa bicyclette pris d'un mur. 




129 



C.Hirt 135 



Le troisifeme type (terminaison 6) est semblable k la terminaison 0, mis k part qu’il 
est compost de 6 syllabes suppl^mentaires (deuxi^me phrase pr^positionnelle enchass^e 
dans la terminaison 3). 

Ce matin, le facteur a laissi sa bicyclette pris d'un mur dans le pare. 

Chacune des phrases a ^t^ construite selon des contraintes phon^tiques (touchant la 
chaine articulatoire et les liaisons), syntaxiques (longueur et structure des phrases) et 
s^mantiques (occurrence et acceptability des phrases par rapport k leur sens). Les crit^res 
phon^tiques (verbe se terminant par une voyelle, segments pr^positionnels commen 9 ant 
par une occlusive, liaisons respect^es ou supprim^es) sont indispensables pour faciliter la 
segmentation de chaque phrase et ^viter de provoquer des modifications de la quality 
articulatoire et du flux de la parole. Selon les crityres syntaxiques, les phrases sont 
structuryes de la meme manifere (compiyment-sujet-verbe-compiyment d'objet-1 h. 2 
compiyments facultatifs) afin de minimiser les diffyrences entre chacune d'elles et 
controler des variables telles que durye des phrases. Pour les entires symantiques, 
chaque phrase doit conserver un sens quelle que soit sa longueur et etre plausible 
indypendamment d'un contexte linguistique. En conclusion, aucune de ces 24 phrases ne 
possyde d'indices phonytiques, syntaxiques ou symantiques qui puissent permettre aux 
sujets d’estimer leur longueur lorsqu’ils entendent le dybut de celle-ci (^ savoir, la 
terminaison 0). Les sujets sont ainsi obligys de se baser sur les informations prosodiques 
prysentes dans chaque phrase pour effectuer la prydiction. 

Les 24 phrases ont yty enregistryes sur cassette et bande magnytique au Laboratoire 
de Traitement du Langage et de la Parole (University de Neuchatel) par deux voix 
fyminines, les 12 premiyres par Tune et les 12 suivantes par I'autre. Le choix des deux 
voix ytait nycessaire pour diversifier les stimuli et yviter une habituation chez les sujets 
ainsi que pour s’assurer que les changements existants entre les caractyristiques 
acoustiques de chaque voix ne sont pas suffisamment importants pour en modifier la 
courbe prosodique et influencer la perception de celle-ci. Malgry de Mgyres diffyrences 
interindividuelles mises en yvidence par I'analyse acoustique des stimuli, on peut 
admettre que ces paramytres sont identiques pour les deux voix. Les locutrices devaient 
lire chaque phrase aprys quelques lectures d'entrainement dans un groupe de souffle pour 
yviter toute coupure ou pause. Une ytude pryalable ayant permis de confirmer que les 
rysultats sont similaires quelle que soit la forme choisie, nous avons adopty un mode de 
prysentation des phrases isoiy, i savoir qu'elles ne sont pas segmentyes mais prysentyes 
dans leur totality. Les 24 phrases ont ensuite yty digitalisyes sur MacAdios. Les silences 
d’enregistrement (prycydant et suivant les phrases) ont yty supprimys. Un bip sonore 
d’une durye d'environ 750 msec, a yty insyry avant chaque phrase suivie d'une pause de 
5 secondes pour permettre aux sujets d'indiquer leur ryponse. Deux bandes 
expyrimentales, contenant chacune les 24 phrases, ont yty pryparyes. Les stimuli ont yty 
prysentys aux sujets selon un meme ordre arbitraire. II nous ytait nycessaire d’adapter 
notre premiyre tache ryalisye avec des sujets normaux aux possibilitys des patients 
cyrybro-iysys pour des raisons de fatigability, prysence d'une aphasie ou de troubles 
associys, capacitys attentionnelles diminuyes, etc... 

Procidure : Les sujets ont yty testys individuellement lors de sessions d'une durye 
de 15-20 minutes sous casque d'yeoute. Chaque sujet a entendu les 24 phrases de la 
bande (3 phrases pour chaque type de terminaison). De la meme fa 9 on que pour le 
matyriel, la procydure de cette tache a yty simplifiye et adaptye aux capacitys et aux 
troubles des patients. Les consignes du test ont yty prysentyes oralement aux sujets avec 
deux exemples afin de s’assurer de la bonne compryhension de la tache. D'autre part, la 
ryponse des patients ytait de nature non verbale par pointage sur support visuel (trois 
barres de longueur diffyrente), le choix du patient devant etre reporty sur la feuille- 
ryponse par I’expyrimentateur ; les troubles du langage ycrit des aphasiques ainsi que les 
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difficult^s grapho-motrices des h^mipl6giques ont ainsi pu etre neutralises. Enfin, il nous 
a paru preferable (en raison des troubles de la lecture) de representer graphiquement les 
differents types de phrases par des bandes horizontales de longueur proportionnelle k la 
duree effective du segment entendu plutot que de les presenter sous forme ecrite. En 
resume, la tache des sujets est limitee k deux etapes : ecouter la phrase presentee apr^s le 
signal sonore puis indiquer la longueur de I’extrait entendu en pointant le schema 
correspondant. 

Analyse des donndes : Nous avons compare, d’une part, les sujets cerebro-ieses 
gauches et droits k leurs sujets-controles apparies quant a I'age et au sexe, et, d’autre 
part, les sujets-controles entre eux. Les resultats, examines par rapport aux trois 
terminaisons, ont ete soumis k une analyse de variance. 

3. Resultats et discussion 

La figure 1 (page suivante) presente le nombre de syllabes estimees 
en fonction du type de terminaison pour les sujets avec lesion gauche et 
leurs controles apparies. D’une maniere g^nerale, les lesions gauches se 
comportent de la meme fa90n que les controles, quelle que soit la 
terminaison. En effet, tous deux per9oivent clairement la difference entre 
une phrase qui se temnine et une phrase qui se poursuit. De plus, ils ne 
distinguent pas les phrases qui continuent (terminaisons 3/6). Deux 
analyses de variance (par sujets et par phrases) confirment ces resultats : 
nous ne trouvons aucune difference entre les groupes ; cependant, le 
facteur Terminaison est significatif (p < 0.001) comme I’est I’interaction 
entre les deux facteurs Terminaison x Groupe (p < 0.01). Une analyse 
post-hoc (Tukey HSD) ne revele aucune difference entre les deux groupes 
au niveau des terminaisons 0 et 3 mais une difference significative au 
niveau de la terminaison 6 (p < 0.05 ; a prendre avec circon speed on car 
elle pourrait constituer un simple effet du hasard). 

La figure 2 (page suivante) pr6sente le nombre de syllabes estimees 
en fonction du type de terminaison pour les sujets avec lesion droite et 
leurs controles. Les lesions droites se distinguent des controles de deux 
manieres : d’une part, elles identifient mal les phrases qui se terminent 
(moyenne de 1,58 pour les terminaisons 0) et d'autre part, elles sous- 
estiment la duree des phrases qui continuent (moyennes de 2,85 et 2,74 
pour les terminaisons 3 et 6 alors que les controles ont des moyennes de 
3,79 et 3,64). Ces constatations sont confirmees par deux analyses de 
variance : bien que nous ne trouvons aucune difference entre les groupes, 
le facteur Terminaison est significatif (p < 0.001) comme Test surtout 
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syllabes) pour les lesions gauches et les controles. Chaque colonne correspond ^ la 
moyenne de 80 observations (8 r^ponses pour chacun des 10 sujets). 
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Figure 2 : Le nombre de syllabes estim6es en fonction du type de terminaison (0, 3. 6 
syllabes) pour les lesions droites et les controles. Chaque colonne correspond k la 
moyenne de 80 observations (8 r^ponses pour chacun des 10 sujets). 
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rinteraction entre les facteurs Terminaison et Groupe (p < 0.001). Une 
analyse post-hoc (Tukey HSD) montre clairement qu’il existe une 
difference significative entre les moyennes des teiminaisons des deux 
groupes. En effet, chacune des moyennes des lesions droites est 
significativement diff^rente de la moyenne des controles (p < 0.05). 
Notons qu’^ I’interieur des groupes, il existe une difference entre la 
terminaison 0 et 3, et 0 et 6, mais pas entre la terminaison 3 et 6. 

La figure 3 (ci-dessous) pr^sente le nombre de syllabes estimees en 
fonction du type de terminaison pour les deux groupes de sujets- 
controles. L'analyse de variance ne montre aucune difference entre les 
groupes qui se comportent de la meme maniere ; par contre, on releve un 
effet principal pour les terminaisons (p < 0.001 ; 0 est different de 3 et de 
6 ; 3-6). 
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Figure 3 : Le nombre de syllabes estim6es en fonction du type de terminaison (0, 3, 6 
syllabes) pour les controles gauches et droits. Chaque colonne correspond h la 
moyenne de 80 observations (8 reponses pour chacun des 10 sujets). 



4. Discussion generate 

Le comportement des patients prdsentant une lesion gauche confirme 
enti^rement I’hypothese que nous avions emise. Le nombre d'erreurs 
relev6 chez ces sujets est faible et ne peut nullement constituer un contre- 
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argument h. une contribution hdmispherique droite dans le traitement de la 
prosodie linguistique. Malgr6 Timportance de leurs troubles du langage, 
les aphasiques ont reussi cette tache d’6valuation de la duree des phrases. 
Aucun lien entre la s6v6rit6 des troubles de la comprehension auditivo- 
verbale (objectives au Token-Test, epreuve de comprehension) et les 
performances des patients n’a pu etre mis en evidence. La presence d’un 
environnement phonetique, syntaxique et semantique autour des stimuli ne 
semble pas avoir influence la perception des sujets. Rappelons que, pour 
effectuer cette tache, les sujets ne pouvaient pas recourir aux informations 
linguistiques contenues dans les stimuli et que seule la prosodie pouvait 
leur foumir les indices necessaires. Les quelques etudes experimentales 
(Baum & coll., 1982 ; Bryan, 1989 ; Emmorey, 1987 ; Heilman & coll., 
1984) dans lesquelles le role des elements linguistiques n’a pu etre 
neutralise, et cela malgre I’apport incontestable de la prosodie, ont sans 
exception engendre des difficultes de comprehension de la prosodie 
linguistique chez les aphasiques. Ces observations demontrent que, 
lorsque le sujet a besoin a la fois des informations prosodiques et 
linguistiques pour effectuer I’analyse de la parole, I'hemisphere gauche 
intervient probablement pour seconder I’hemisphere droit dans le 
traitement de la prosodie linguistique. Cependant, nos resultats (comme 
ceux de Blumstein & Goodglass, 1972 ; Green & Boiler, 1974 ; Lonie & 
Lesser, 1983) suggerent que lorsque le contenu semantique des stimuli, 
bien que present, ne constitue pas un apport pour realiser la tache, la 
prosodie linguistique est traitee principalement par Themisphere droit. 

Plusieurs points sont a relever dans le comportement des lesions 
droites. Tout d’abord, le nombre de fausses identifications est ties eieve, 
ce qui constitue un fort argument en faveur de I’hemisphere droit. On 
note, par ailleurs, une tendance generate ^ effectuer de faibles 
estimations ; ce manque de precision reflete probablement I'incertitude 
des sujets face a la tache et leurs difficultes de perception de la prosodie 
linguistique k I’endroit d'une frontiere syntaxique majeure. Nos resultats 
(comme ceux de Bryan, 1989; Buttet Sovilla, 1988 ; Heilman & coll., 
1984 ; Lonie & Lesser, 1983 ; Weintraub & coll., 1981) appuient 
I'hypothese d'une importante contribution de I’hemisphere droit dans ce 
type de traitement prosodique. Qu'il s’agisse de taches de discrimination 
ou d’identification, les lesions droites demontrent des performances plus 
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pauvres que celles des sujets normaux et des aphasiques avec lesion 
gauche. 

En conclusion, ces nouvelles observations parlent nettement en faveur 
d'un traitement h^misph^rique droit de la prosodie. Neanmoins, cela ne 
permet pas d’exclure I’idee d’une participation bihemispherique, en 
particulier lorsqu’il y a intervention simultanee de facteurs linguistiques 
et prosodiques dans I'analyse de la parole. 
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Perception cat^gorielle et sujets c4r4bro-14s4s : 
donn^es pr^liminaires^ 

Karin Klose 



R4sum4 



Cet article d^crit le ph^nom^ne de la perception cat^gorielle et pr^sente 
les T^sultats obtenus h I'aide dun test d'identification (continuum acoustique 
"camp-gant") avec des sujets c6r6bro-16s^s : 12 sujets avec une lesion 
h^misph^rique gauche et des troubles du langage associds (aphasie) et 6 
sujets avec une lesion h^misph^rique droite. Les patients aphasiques 
pr^sentent une fronti^re cat^gorielle nette, analogue a celle des sujets avec 
lesion droite et des sujets controles. L'aphasie en tant que telle ne cause done 
pas de troubles de perception cat6gorielle. Par contre les aphasiques se 
distinguent des autres sujets au niveau de la perception des extr^mit^s du 
continuum. 

1. Introduction 

La categorisation est un phenom^ne universel chez rhomme. Celui-ci 
analyse les objets et les evenements de son environnement en termes de 
categories, natu relies ou arbitral res. 

On retrouve aussi ce phenom^ne dans la perception du langage, et ce 
a tous les niveaux : semantique, syntaxique, lexical, etc. Au niveau 
phon^tique, les sons du langage sont classes en categories et ils sont 
per^us en fonction de celles-ci. Dans ce cas, on parle de perception 
categorielle (que nous ecrirons par la suite P.C.). A titre d'exemple, la 
P.C. nous permet de differencier le lexeme pain du lexeme bain. De plus, 
elle nous permet de les distinguer dans une phrase, qu’elle soit prononcee 
par X ou Y et ceci en depit de variations acoustiques evidentes. Nous 
pouvons ainsi avoir une representation unique des sons du langage a 
I’interieur d’une communaute donnee, ce qui evite qu’il y ait autant de 
representations que d’individus. 



^Cet article est issu dun memoire de diplome d'orthophonie (Universit6 de Neuchatel, 
1990) effectue lors dun stage dans la division de Neuropsychologie du CHUV. Le 
memoire a 6t6 r6alis6 en partie avec Florence Lambert (article publi6 dans ce numdro). 
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Les recherches sur la P.C. ont d6but6 au laboratoire Haskins ^ New 
Haven en 1957, sous la direction de A. Liberman. La premiere 6tude 
publi^e par Liberman, Harris, Hoffman et Griffith (1957) a servi de 
modele ^ beaucoup d'autres. Pour tester la P.C. il faut un continuum 
acoustique et deux tests (identification et discrimination). Le continuum 
est construit normalement de la manifere suivante. Deux syllabes simples 
(fornixes d'une consonne et d'une voyelle) constituent les extr^mit^s du 
continuum ; leur consonne difftre au moins par un trait. Dans la 
premiere experience des chercheurs du laboratoire Haskins, il s'agissait 
du voisement. Entre ces deux syllabes sont construits une dizaine d'items 
intermediaires qui varient de fa 9 on continue et qui relient ainsi par 
petites etapes les deux extremites. Le continuum sert de base aux tests 
suivants : 

a) (/n test dHdentification : il s'agit de reconnaitre les stimuli 
pr^sentes dans un ordre al^atoire. La tache des sujets est d'identifier 
chaque item comme appartenant k la cat^gorie de I'une ou I'autre des 
extr^mites du continuum. 

b) Un test de discrimination : les stimuli du continuum sont 
pr^sentes deux par deux selon la m^thode dite ABX ou A et B sont 
voisins sur le continuum et X semblable ^ A ou ^ B. Les sujets sont 
appel^s a indiquer si le dernier des trois stimuli (X) est identique a A ou 
^iB. 



Afin d’illustrer ceci, prenons un continuum [bu]-[pu] qui varie selon 
le trait de voisement et analysons des donn^es th^oriques (exemple bas6 
en partie sur I'illustration de Petitot-Cocordat (1984)). La figure 1 (page 
suivante) montre que I'auditeur classe les stimuli en deux categories bien 
distinctes, repr^sentees par les deux poles du continuum ([bu] et [pu]). On 
remarque une pente qui correspond au passage abrupt d'une categorie a 
I’autre. La frontifere cat^gorielle se trouve au point ou la pente est 
maximale. Lorsque dans un test de discrimination, les elements sont 
pr^sentes en triades ABX (ex. A correspond au premier element, B au 
deuxifeme et X est ^ nouveau le premier 616ment), nous observons un pic 
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[bu] Stimuli tP“] 

Figure 1 : R^sultats obtenus lors d’une tache d'identification des ^l^ments d*un 
continuum [bu]-[pu]. Sur I'abscisse sont repr^sent^s les 1 1 ^l^ments du continuum, 
allant de [bu] ^ [pu]. Sur I'ordonn^e, figure le pourcentage de stimuli identifies soit 
comme [bu] soit comme [pu] (d’apr^s Petitot-Cocorda, 1984, p.249). 




Figure 2 : R^sultats obtenus lors dune tache de discrimination des elements d’un 
continuum [bu]-[pu]. Sur I’abscisse sont indiqu^es les paires AB formees en 
progressant de [bu] k [pu] avec des stimuli voisins sur le continuum (1-2, 2-3,...). 
Le pourcentage de discrimination figure sur I'ordonnee (d’apr^s Petitot-Cocorda, 
1984, p.249). 
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de discrimination h I’emplacement de la chute dans la courbe 
d'identification (voir Figure 2, page precedente). Les stimuli identifies 
comme appartenant a la meme cat^gorie lors de la tache d’identification 
ne sont pas, ou tr^s difficilement, discrimines. Par contre, la 
discrimination inter-cat^gorielle est bonne. Dans la realite, les resultats 
obtenus montrent rarement une P.C. aussi nette ce qui explique que Ton 
parle plutot de degre de P.C. 

La premiere etude des laboratoires Haskins a ouvert la voie k tout un 
champ d’experiences dans ce domaine. Les continuums sont construits a 
partir de materiel verbal qui diff^re selon un ou plusieurs des traits 
suivants : voisement (ex. : [d] - [t]) ; point d’articulation (ex. : [b] - [d] - 
[g]) ; duree du silence (ex. : "Montrez-moi les ch^ues" / ”Montrez-moi 
les — cheques" pergu comme tcheques, Aubert & Assal, 1980). Certains 
stimuli non-verbaux offrent aussi une P.C. (ex.: les intervalles musicaux 
chez les musiciens). Les recherches ont parfois donne lieu a des resultats 
divergents quant a la presence ou I’absence de perception categorielle. 
Repp (1983) donne un compte rendu des principales observations. 

Differentes explications de la P.C. ont ete avancees mais il faut 
souligner qu’aucune d’entre elles n’est entierement satisfaisante et que 
bien des recherches devront encore etre faites pour mieux cerner le 
probleme. Nous allons bri^vement decrire les courants principaux : 

- La theorie motrice de la perception. II s'agit d’une theorie generale de 
la parole. Selon ce modele, la parole est perdue en faisant reference a la 
maniere dont on articule les sons, et non aux differences acoustiques. 
Bien que la parole soit variable, les gestes articulatoires ne le sont pas ; 
I’interlocuteur y fait reference, ce qui lui permet d’identifier les 
phonemes. Cette theorie expliquerait un sous-phenomene : la P.C. 

- Le modele du double traitement (“The dual-process Model”). Cette 
theorie fait I’hypothese d’un traitement des sons du langage k deux 
niveaux : Tun auditif qui traduit les donnees auditives en parametres 
acoustiques (il est lie k une m^moire auditive k tres court terme) ; 
I’autre phonetique qui s’occupe de I’etiquetage phonetique et dont la 
trace mnesique est legerement plus longue et rattachee k une memoire 
phonetique. 
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- Le modele de traitement unique ("Common Factor Model"). II s'agit 
d'un modele assez recent selon lequel la P.C. aurait lieu a un niveau 
psycho-acoustique, et non acoustique. Les stimuli sont classes dans des 
zones psycho-acoustiques qui coincident avec les categories phonetiques. 

Le phenomene de la perception categorielle a 6te etudie non 
seulement chez les sujets normaux (adultes et enfants) mais egalement 
chez les cerebro-leses et, plus particulierement, les aphasiques. L'aphasie 
apparait souvent suite a une lesion cerebrale dans rhemisphere gauche, 
ITiemisphere dominant pour le langage. Hecaen & Lanteri (1983) donnent 
la definition suivante de ce phenomene : 

"Trouble de remission ou de la reception de signes verbaux, survenu en dehors de 
toute atteinte piriphirique [bouche, langue, etc.], en rapport avec une lision ciribrale 
localisie et circonscrite, et chez un sujet dont Vexercice de la parole itait normal 
auparavant" 

La lesion peut etre due a un accident vasculaire (attaque, ictus...), a 
un traumatisme (accident, choc...) ou a un processus expansif (tumeur, 
abces...). Au niveau clinique, les symptomes aphasiques sont variables. Ils 
comprennent des perturbations a differents niveaux, dans la perception et 
la production d'aspects phonetiques, phonologiques, syntaxiques et 
s6mantiques du langage. Les tableaux different pour chaque patient selon 
la severite des troubles, la specificity des difficultes langagieres, les 
troubles assoc ies, etc. 

Plusieurs etudes de P.C. ont ete effectuees avec des sujets cerebro- 
leses a I’aide de tests d'identification (et parfois de discrimination). 
Certaines de ces experiences se servent de sons naturels, d'autres de sons 
synthetiques, mais proches du langage oral.2 On remarque que, dans 
I’ensemble, les recherches effectuees avec differents continuums 
produisent des resultats concordats, a savoir : 



^Certains auteurs ont utilise un continuum voisy/non-voisy. Par exemple : Blumstein, 
Cooper, Zurif & Caramazza (1977) et Basso, Casati & Vignolo (1977). D'autres yquipes 
de chercheurs ont fait varier leur continuum d'apr^s le point d’articulation des phonemes : 
Yeni-Komshian & Lafontaine (1983) et Blumstein, Tartter, Nigro & Statlender (1984). 
On trouve aussi une ytude se basant sur la variation d un intervalle de temps a Tinterieur 
d un ynoncy : Python-Thuillard & Assal (1987). 
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- les sujets avec lesions h6misph6riques droites, ainsi que les sujets avec 
lesions h6misph6riques gauches sans aphasie, ne montrent pas de 
r^sultats significativement diff^rents des sujets de controle. Ils 
pr^sentent tous une categorisation nette des stimuli du continuum. 

- la plupart des sujets aphasiques avec lesion gauche obtiennent des 
resultats significativement diffe rents des sujets de controle. La majority 
pr^sentent en effet, pour les consonnes occlusives, soit une P.C. alter^e, 
soit une absence de P.C. On peut noter cependant que tous les sujets 
aphasiques ne presentent pas une alteration de la frontiere categorielle. 

Ces resultats soulignent bien Timportance du role joue par 
rhemisph^re gauche dans la perception des phonemes et done des traits 
acoustiques (voisement, point d’articulation...). Cest cet hemisphere qui 
semble etre egalement le siege principal des processus sous-jacents au 
phenomene de la P.C. Mais etant donne que les processus cerebraux mis 
en jeu lors de la perception phonetique sont encore trop peu connus, il 
convient de rester prudent quant a une localisation exacte de la perception 
du Ian gage dans Hiemi sphere gauche du cerveau. 

Comme la plupart des experiences ont ete faites en anglais, a I’aide 
de continuums qui mettent en valeur les traits importants de cette langue, 
il nous a semble int^ressant de mener une ^tude sur des patients 
aphasiques francophones a I’aide d'un test fran 9 ais (Grosjean et 
Dommergues, ce numero). Ce test a I’avantage d’etre en fran 9 ais (ce qui 
est rare dans la litterature), d’utiliser des consonnes occlusives (ce sont 
elles qui montrent le mieux la perception categorielle) et d’etre realist a 
partir de la parole naturelle et non de materiel synthetise (comme e'est le 
cas dans la plupart des recherches). Il preserve done les variables de la 
parole et reste proche du langage quotidien. Dans ce qui suit nous allons 
comparer les performances de sujets aphasiques a des sujets de controle et 
a des sujets avec lesions c6rebrales droites dans une tache d’identification. 

2. M^thode 

Sujets : 30 sujets ont particip6 ^ cette 6tude. Ils ont tous iii choisis selon les entires 
suivants : droitiers (entire v6rifi6 avec Tindex de lateral! sation d'Oldfield), francophones 
(le fran^ais comme premiere langue apprise et encore parl^e) et sans baisse d'audition 
(entire v6rifi6 ^ I'aide d'un audiogramme tonal dans les frequences de la parole, e’est-^- 
dire entre 10(X) et 3000 Hz. et ce jusqu'^ 30 dB.). Le niveau socioculturel n'a pas €x€ 
consider^ comme un critere de selection. 
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- 12 sujets-controles : 5 femmes et 7 hommes, de 27 h 69 ans, leur moyenne d'age 
dtant de 56 ans (6cart-type = 12). Ils ont 6i6 choisis de fa 9 on a pouvoir etre appariis 
suivant I'age aux sujets aphasiques. Ils n'ont pas d'ant6c6dents neurologiques. 

- 12 sujets aphasiques : 3 femmes et 9 hommes, de 29 ^ 71 ans, leur moyenne d'age 
dtant de 55,7 ans (6cart-type = 13,5). Ils ont tous une 16sion strictement unilat6rale, 
focalis6e, d'origine vasculaire ou tumorale, v6rifi6e par un CT-Scan c6r6bral. Ces 
patients ont tous subi un test de comprehension auditive (le Token-Test d'apr^s De Renzi 
& Faglioli, 1978) et leurs scores, corriges en fonction du niveau socioculturel (nombre 
d'ann^es de scolarite et formation professionnelle suivies) r^v^lent tous une 
comprehension auditivo-verbale insuffisante, voire sev^rement deficitaire. 

- 6 sujets avec lesion hemispherique droite : 3 femmes et 3 hommes, de 50 ^ 64 ans, 
leur moyenne d'age etant de 57 ans (ecart-type = 5,5). Ils n'ont pas de troubles du 
langage. Ils ont egalement une lesion unilaterale, focalisee, d'origine non-traumatique, 
localisee grace au CT-Scan. 

Matdriaux : La tache d'identification a ete limitee h 60 items en raison de la 
fatigabilite des patients. Les 12 items du continuum "camp-gant" sont done present6s 5 
fois, en ordre aieatoire. L'intervalle entre chaque stimulus est de 2 secondes. Deux 
cartes, I'une illustrant un camp et I'autre un gant, sont presentees au sujet. Celui-ci 
repond en pointant vers I'une des deux cartes. 

Procedure : Avant le test, un entrainement a lieu, afin de s'assurer de la bonne 
comprehension de la consigne. L'examinateur prononce 10 phrases du genre "montrez le 
camp" (5 fois) et "montrez le gant" (5 fois), dans un ordre aieatoire. Si le sujet n'obtient 
pas 90% de reponses correctes, un second entrainement a lieu. Si h. nouveau le sujet 
n'atteint pas une performance de 90%, il est eiimine de I'etude. Puis on fait passer le test, 
de fa 9 on individuelle et dans une pifece calme, avec port du casque (a un volume 
d'audition de 40 dB.). 

Analyse des donndes : Pour chaque courbe nous avons obtenu les deux mesures 
suivantes : 

- L'emplacement de la frontifere perceptive : Avant de calculer cet emplacement, nous 
avons du determiner si la fronti^re 6tait pr6sente (il fallait 60 a 80% de chute, sur 7 
elements au maximum). Puis, nous avons trouv6 le point sur la fronti^re qui correspond 
au moment ou le sujet per 9 oit 50% de "camp" et 50% de "gant". C'est Egalement 
I'endroit ou la pente de la frontiere est maximale. L'emplacement a calcuie ainsi : a 
chaque point de la pente, nous avons attribue la valeur de pr6voisement correspondante. 
A partir de ces valeurs, la ligne de regression a iii calcul^e (c'est la droite qui se situe ^ 
une distance minimale de chaque point). L'endroit de cette pente qui correspond a 50% 
de "camp" nous donne l'emplacement de la frontiere ; celle-ci est determinee par sa valeur 
de prevoisement sur I'abscisse. 

- L'indice d'ancrage : Pour obtenir cet indice il nous a fallu d'abord obtenir 
I'ancrage des extremites du continuum. Celui-ci est donn6 par deux mesures. Tune 
correspondant h. la moyenne des valeurs des points situ6s k gauche de la pente et I'autre 
par celle des points situ6s k droite. La valeur des points est calcul^e en % de variation par 
rapport h. des valeurs "id6ales" (stimuli per 9 us k 1(X)% comme "camp" k gauche de la 
fronti^re ; stimuli per 9 us k 100% comme "gant" k droite de la pente). Cette mesure 
conceme done la perception des stimuli intra-cat6goriels, de part et d'autre de la fronti^rc. 
Afin de pouvoir comparer ces valeurs d'ancrage entre les diff^rentes populations 
6tudi€es, un calcul suppl6mentaire a 6i6 introduit : le calcul de l'indice d'ancrage (I. A.). 
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Pour trouver cet indice, la moyenne des valeurs d'ancrage des points h droite et k gauche 
de la fironti^ est calcul^e. 

3. R^sultats 

Dans le Tableau 1 nous presentons les rdsultats obtenus pour 
remplacement de la frontiere perceptive et I'indice d'ancrage. 



Groupe 


Emplacement de 
la frontiere (msec) 


Indice d'ancrage 


Controles (n=12) 


32,98 (8,57) 


1,96 (2,67) 


Lesions droites (n=6) 


37,15 (17,04) 


0,33 (0,75) 


Lesions gauches (n=12) 


28,93 (9,15) 


9,63 (7,36) 



Tableau 1. Moyennes et dcart-types (entre parentheses) des emplacements de la 
frontiere perceptives et des indices d'ancrage pour les trois groupes : controles, 
lesions gauches et lesions droites. 



• Les sujets-controles : Les r^sultats obtenus correspondent k notre 
attente. Les courbes ressemblent k celles des sujets-pilotes (ayant participe 
a la validation du test) dont la moyenne d'age est plus basse. La moyenne 
de I'emplacement des frontieres se situe k 32,98 msec de prevoisement 
(6cart-type = 8,57). Elle etait de 40 msec pour le premier groupe etudie, 
celui des sujets-pilotes (qui etaient plus jeunes). La frontiere moyenne des 
sujets-controles est done plus proche de I'extr^mite "camp" que celle des 
sujets-pilotes qui classent plus tard les sons dans la categorie /g/ 
(difference significative : t = 2,20; df 22; p < 0,05). L'indice d'ancrage 
moyen des sujets-controles est de 1,96 (dcart-type = 2,67). 

- Les sujets avec lesion cerebrate droite : Ces sujets presentent 
egalement tous une frontiere perceptive nette. La moyenne des 
emplacements des frontieres se situe a 37,15 msec de prevoisement 
(6cart-type = 17,04). Elle n'est pas significativement differente de celle 
des sujets-controles (t = 0,65; df 16; N.S.). La moyenne des LA. qui est 
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0,33 (ecart-type = 0.75), n’est pas significativement differente de celle 
des sujets-controles (t = 1,39; df 16; N.S.). 

- Les sujets aphasiques : Une frontiere perceptive a pu etre mise en 
evidence chez les sujets aphasiques mais elle est souvent peu nette (voir 
Figure 3 & la page suivante). L’emplacement de la frontiere se situe en 
moyenne a 28,93 msec de pr6voisement (ecart-type = 9,15) ce qui n'est 
pas significativement different des sujets-controles et des sujets avec 
lesions droites (t = 1,07 ; df 22 ; N.S. t = 1,26 ; df 16 N.S. 
respectivement). La valeur moyenne des I.A., par contre, est de 9,63 
(ecart-type = 7,36), valeur significativement differente de celle des sujets- 
controles et des sujets avec lesion hemispherique droite (t = 3,25 ; df 22 ; 
p < 0.01 et t = 2,91 ; df 16 ; p < 0.05, respectivement). 

4. Discussion 

Les sujets aphasiques pnesentent pour la plupart une frontiere 
perceptive mais ils se differencient de maniere significative des deux 
autres groupes au niveau de la perception intra-categoriel des stimuli. 
L’identification phonetique de ces stimuli n’est pas stable et quelques 
sujets semblent meme presenter une ebauche de frontiere a I’interieur des 
categories perceptives (le sujet 7 a I’item 8, par exemple). De plus, on 
remarque que les stimuli 1 et 12 (extremites du continuum) ne sont pas 
toujours per 9 us correctement. 

Comment interpreter la presence d’une frontiere categorielle mais 
une perception instable des extremites du continuum? On ignore a quel 
moment le processus d’identification phonetique est altere suite a la lesion 
cerebrale : input du stimulus (perception), traitement de I’information 
(categorisation) et/ou reponse du sujet. Voici quelques hypotheses qui 
peuvent etre avancees : 

- Suite a une lesion cerebrale, des troubles apparaitraient au niveau 
de I’analyse acoustique du stimulus. Les sujets auraient des difficultes a 
traduire en une image acoustique (analyse spectrale) I’onde sonore qu’ils 
per 90 ivent et de ce fait seraient incapables d’identifier toujours 
correctement ce qu’ils ont per 9 u. 
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Figure 3. Les courbes d’identification des sujets aphasiques (n=12). 
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- Des difficult^s existeraient au niveau phon6tique : les sujets 
n’arriveraient pas k attribuer une etiquette phonetique a I'image 
acoustique perdue. Le passage de Tidentite acoustique k I’identite 
phonetique serait trouble. 

- Une perturbation au niveau de la reponse expliquerait egalement ces 
performances : le sujet aurait choisi correctement /k/ ("camp”) ou /g/ 
("gant") mais ferait une erreur lors de I’indication de I’image du camp ou 
du gant. 

II est probable que plusieurs des facteurs interviennent simultan^ment 
et differemment selon les types d’aphasie (Assal, 1974). 

En guise de conclusion, notons qu’il serait interessant de poursuivre 
ces recherches avec le meme test mais avec un nombre plus important de 
sujets aphasiques afin de former des sous-groupes selon les differents 
syndromes aphasiques. Ceci permettrait d'approfondir les observations 
deja r^alisees et d’apporter de nouveaux Elements afin de mieux 
comprendre la perception categorielle chez les sujets cerebro-leses. 
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Perception cat^gorielle et troubles du langage 4crit 
Florence Lambert-Dutoit 



R4sum4 



Cette dtude compare la perception cat^gorielle d‘enfants dyslexiques k 
celle d’enfants sans difficult^s d‘apprentissage du langage ^rit. Les enfants 
des deux groupes ont passd un test d’identiflcation bas^ sur le continuum 
"camp'gant" ddveloppd par Grosjean et Dommergues (ce num^ro). Aucune 
difference significative n’apparait entre les deux groupes, ni au niveau de 
I’emplacement de la frontiere perceptive ni dans la variation intra-categories. 
Quelques hypotheses sont presentees pour expliquer cette similitude. 

1. Introduction 

La categorisation est un phenomene universel qui sert, entre autres, k 
organiser et k traiter le langage. Au niveau de la perception de la parole, 
les sons sont classes en categories et nous les percevons en fonction de 
celles-ci ; c’est ce qu’on appelle la perception categorielle (P.C.). Elle 
permet une representation unique des sons du langage a I’interieur d’une 
communaute linguistique, en depit de variations individuelles. Par contre, 
ces categories varient d’une langue a I’autre (voir Tarticle de K. Klose, ce 
numero, pour une description generale de la P.C.). 

Apr^s avoir valide le continuum acoustique eiabore par Grosjean et 
Dommergues (ce numero) avec des sujets-controles (Dutoit, 1989 ; Klose, 
1990), il nous a sembie interessant de nous pencher sur les enfants 
dyslexiques, a savoir ceux qui presentent des difficultes dans 
Tapprentissage du langage ecrit. Nous voulions repondre aux deux 
questions suivantes : 

1) Les enfants avec des difficultes dans Tapprentissage du langage 
ecrit possedent-ils une frontiere categorielle ? 

2) Dans Taffirmative, est-elle comparable a celle d’enfants-controles ? 

De nombreuses etudes ont menees sur des enfants dysphasiques 
(presentant un retard de langage), alors que celles menees sur des enfants 
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dyslexiques (avec difficult6s d’apprentissage du langage 6crit) sent moins 
nombreuses. De meme, des experimentations ont 6te plus souvent faites 
sur des enfants en bas age, a notre connaissance, que sur des plus grands. 

II est bien connu que les enfants perfoivent les sons de la parole de 
fa 9 on catigorielle (pour une revue de la littirature, voir entre autres, 
Eimas, Miller et Jusezyk, 1987) mais nous n’avons que peu de donnies, 
d'ailleurs souvent contradictoires, sur la perception catigorielle des 
enfants dyslexiques. Tallal (1980), par exemple, arrive a la conclusion 
qu’un micanisme perceptif “primaire” serait a la base de quelques 
difficultis dans I’analyse efficace du code phonitique et finalement dans 
I’apprentissage de la lecture. Brandt & Rosen (1980), quant a eux, ne 
dimontrent pas de dificits phonologiques ividents chez leurs sujets 
dyslexiques, alors que ceux de De Weirdt (1988) se montrent moins 
performants que les sujets-controles dans toutes les taches. Nianmoins, 
itant donni les friquentes confusions phonitiques et les difficultis de 
discrimination auditive rencontries chez certains “dyslexiques”, nous 
formulons I'hypothese qu’un dificit phonitique pourrait exister chez 
quelques-uns d ’entre eux et qu'il serait iventuellement dicelable par un 
test de perception catigorielle. 

2. Mithode 

Sujets : Onze enfants dyslexiques qui ripondaient aux criteres suivants : droitiers, 
francophones, sans trouble auditif apparent (controle auditif lors du bilan), sans trouble 
psychologique important (entretien avec un pidopsychiatre lors du bilan), traitement pris 
en charge par I’AI sous Titiquette “dyslexie-dysorthographie”^. Ces enfants dont la 
moyenne d'age est de 10,65 ans vont k Ticole publique ; ils suivent tous un traitement 
logopidique, mais ont iti choisis parmi les patients de quatre logopddistes diffirentes. 

Des sujets-controles ont iti appariis k ces enfants au niveau du sexe, du degri 
scolaire et de la moyenne d’age, qui est de 10,82 ans. Ils ont iti choisis par leur 
enseignant pour ripondre aux memes entires que ceux des enfants dyslexiques sauf en ce 
qui conceme le dernier point : ils ne devaient avoir aucune difficulti en fran 9 ais. 



1 “Dyslexie : trouble de I’apprentissage de la lecture qui peut se manifester dis le dibut de 
la scolariti primaire k diffirents niveaux : perceptif, de comprihension, de dicodage, de 
recherche d’information, etc. Ce trouble est en giniral associi k un trouble 
d’apprentissage du code icrit, mais il peut se trouver de maniire isolie. (...) 

Dysorthographie : trouble de I’apprentissage de I’icriture pouvant apparaitre dis le dibut 
de la scolariti primaire, k diffirents niveaux : perceptif, mitalinguistique, de I’encodage, 
de la communication icrite, etc. (...)” 
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Matiriel : Le test de P.C. (perception cat^gorielle) a ^te construit au laboratoire de 
traitement du langage et de la parole de I’universit^ de Neuchatel (Grosjean et 
Dommergues, ce num^ro) selon le module du laboratoire Haskins (Cf. notamment Repp, 
1983). II se pr^sente sous la forme de deux epreuves : 1 ’identification et la discrimination 
de stimuli d’un continuum verbal. 

Procedure : Seul le test d’identification a ^t^ retenu (la tache de discrimination 
n’apportant aucune information suppl^mentaire). II comportait 96 items (8 groupes de 12 
stimuli) au lieu des 120 prevus, ceci h cause d’une certaine impatience constat^e lors d’un 
pr^-test sur des enfants. 

Deux dessins ont ^te effectu^s, illustrant un camp (tentes d’Indiens) et un gant. 
Aprfes avoir r^pondu oralement aux questions permettant de determiner I’index de 
lat^ralisation selon Oldfield-Edinburgh, les enfants ^coutaient la consigne suivante : 

"Tu vas entendre des phrases du type “Montrez le camp” ou “Montrez le gant” ; je te 
demande de m’indiquer, aprfes chaque phrase, si le dernier mot est “camp” ou 
“gant”, en me montrant le dessin correspondant. Quelquefois tu auras des doutes, 
mais je te demande quand meme de choisir un des dessins. Tu devras r^pondre 
assez rapidement, car il n’y a que deux secondes entre chaque phrase. Apr^s 
plusieurs phrases, il y aura un silence un peu plus long et tu entendras les mots 
“groupe suivant”, et tu continueras ; il y aura en tout huit groupes de phrases." 

Un essai oral ^tait effectue, puis d^butait la tache d’identification proprement dite ; 
les sujets ^coutaient les stimuli, enregistres sur bande magn^tique (appareil N 2536 
Philips), a I’aide d’un casque. Ce test se d^roulait sans interruption. L’image d^sign^e 
^tait coch^e, puis les r^sultats ont ^te analyses et transcrits graphiquement. 

Analyse des donnies : Pour chaque courbe d’identification, et comme dans I'^tude 
de Klose (ce num^ro), nous avons obtenu les deux mesures suivantes : 

- L'emplacement de la frontifere perceptive : Avant de calculer cet emplacement, nous 
avons du determiner si la frontifere etait pr^sente (il fallait 60 h 80% de chute, sur 7 
elements au maximum). Puis, nous avons trouv^ le point sur la frontifere qui correspond 
au moment ou le sujet per 9 oit 50% de "camp" et 50% de "gant". C'est egalement 
I’endroit ou la pente de la frontiere est maximale. L’emplacement a 6i6 calculi ainsi : a 
chaque point de la pente, nous avons attribu^ la valeur de pr^voisement correspondante. 
A partir de ces valeurs, la ligne de regression a ete calcuiee (c’est la droite qui se situe a 
une distance minimale de chaque point). L'endroit de cette pente qui correspond h. 50% 
de "camp" nous donne l’emplacement de la frontifere ; celle-ci est determinee par sa valeur 
de prevoisement sur I'abscisse. 

- L'indice d’ancrage : Pour obtenir cet indice il nous a fallu d'abord obtenir 
I'ancrage des extremites du continuum. Celui-ci est donne par deux mesures, I’une 
correspondant h la moyenne des valeurs des points situes a gauche de la pente et I'autre 
par celle des points situes a droite. La valeur des points est calcuiee en % de variation par 
rapport h des valeurs "ideales" (stimuli per 9 us a 100% comme "camp" h gauche de la 
frontiere; stimuli per 9 us k 100% comme "gant" a droite de la pente). Cette mesure 
conceme done la perception des stimuli intra-categoriels, de part et d’autre de la frontifere. 
Afin de pouvoir comparer ces valeurs d'ancrage entre les differentes populations 
^tudi^es, un calcul suppl^mentaire a ^t^ introduit : le calcul de l'indice d'ancrage (I.A.). 
Pour trouver cet indice, la moyenne des valeurs d'ancrage des points a droite et a gauche 
de la frontifere est calcuiee. 
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3. R^sultats 

Les figures des pages suivantes montrent les courbes d'identification 
obtenues pour les enfants dyslexiques (Figure 1) et les enfants-controles 
(Figure 2). Chaque courbe correspond a un enfant. En abscisse sont 
repr6sent6s les 12 items du continuum de “camp” a “gant” ; en ordonn6e, 
le pourcentage de stimuli identifies comme “camp”. 

Comme nous pouvons I'observer, les enfants des deux groupes ont 
une frontiere categorielle nette, meme si, chez certains, la pente a parfois 
ete difficile i delimiter. Les courbes des enfants dyslexiques ressemblent 
fort h celles des sujets-controles. 

La mesure de I’emplacement de la frontiere perceptive confirme cette 
observation. Elle se situe en moyenne h 36,64 msec de prevoisement 
(ecart-type 7.91) pour les enfants dyslexiques et k 35,73 msec (ecart-type 
3.05) pour les enfants-controles. Cette tres legere difference n*est pas 
significative (t = 0.34 ; df 20 ; NS). Le seul enfant qui se d^tache 
leg^rement du lot est le n® 1 ; lors du bilan, il s’est avere que cet enfant 
faisait beaucoup de confusions sourdes / sonores, dont M et /g/ ; mais on 
s’aper 9 oit que c'etait le cas pour la plupart des autres aussi. On peut 
egalement faire quelques autres hypotheses : ces enfants ont ete testes en 
hiver - p6riode de rhume - et une legere baisse momentan^e de I’audition 
est possible. De plus, T experimentation n’ayant pu se faire dans une piece 
insonoris6e, des bruits peuvent 6galement etre k I’origine des quelques 
resultats 16gerement “deviants”. 

En ce qui conceme I’ancrage des extremites, 9 des 11 enfants 
dyslexiques montrent des ancrages nets, avec des moyennes egales ou 
proches de 0. Le n° 5 pose des problemes car sa pente commence dej^ k 
Fitem n® 1 ; d’un point de vue strict, ce sujet n’aurait done pas d’ancrage 
k gauche. II a pourtant €i€ decide que ce premier point de la pente serait 
aussi son point d’ancrage - sa pente descendant ensuite (presque) 
regulierement. Le n° 1 est celui dont le % de variation est le plus grand 
par rapport aux valeurs ideales (ancrage a 9,37 des deux cotes). Les 
enfants-controles montrent en moyenne des points plus nets et proches de 
0 que les dyslexiques, k part le sujet n° 2. Mais k nouveau la difference 
entre les deux groupes n'est pas significative. 
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En somme, nous nous trouvons en presence de 22 graphiques qui se 
ressemblent fortement et qui ne permettent en aucun cas de differencier 
les deux groupes. Tous les sujets montrent une P.C. nette. 

4. Discussion g6n6rale 

Si nous reprenons les deux questions du depart (Les enfants avec des 
difficultes dans Tapprentissage du langage ecrit possedent-ils une 
frontidre categorielle ? Dans raffirmative, est-elle comparable a celle 
d’enfants-controles ?), nous pouvons r6pondre de maniere affirmative aux 
deux. En effet, les sujets dyslexiques ont montre des courbes 
d’identification tout a fait comparables a celles des enfants-controles. 
Comment expliquer cette similitude ? Quelques suggestions peuvent etre 
proposees. 

II est admis qu’une connaissance implicite du langage parle est 
necessaire pour apprendre a lire. Mais ceci etant generalement le cas, ce 
n’est pas la que reside une des explications des difficultes dans 
I’acquisition de la lecture. Certains auteurs - notamment Alegria & 
Morais (1979) - preconisent qu’une conscience explicite de certaines 
caracteristiques du langage, et notamment celle des phonemes, serait aussi 
necessaire pour apprendre a lire. II a ete montre que la segmentation en 
syllabes 6tait beaucoup plus facile que la segmentation en phonemes, et 
realisee plus precocement. On peut done faire I’hypothese que des 
difficultes en lecture pourraient etre liees a des problemes d’analyse au 
niveau phonetique. 

II est possible de poser le probleme differemment : “Dans quelle 
mesure la decouverte de la structure phonetique est-elle un prerequis du 
processus d’apprentissage ou depend-elle de celui-ci ?” (in Alegria & 
Morais, 1979). Un argument en faveur de la seconde hypothese serait, par 
exemple, I’experience realisee sur des adultes analphabetes par Morais, 
Cary, Alegria & Bertelson en 1979 (citee par Alegria & Morais, 1979). 
Ces adultes, tout comme les enfants tres Jeunes, etaient pratiquement 
incapables de segmenter la parole en phonemes, alors que leur 
performance etait nettement meilleure lorsqu’il s’agissait de le faire en 
syllabes. Un groupe de sujets alphabetises tardivement a ete test6 en 
parallele et s’est montre nettement plus performant que le premier. Nous 
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pouvons done penser que la lecture d6veloppe Thabilete d’analyse 
phon6tique. Or les sujets dyslexiques que nous avons testes ont tous eu 
deux ans au moins d’apprentissage du langage ecrit, ce qui a pu avoir un 
effet sur leurs r6sultats. De plus, tous ces enfants suivent un traitement 
logopedique depuis plusieurs mois, et nous pouvons done imaginer que 
tout un travail d’dcoute, de discrimination de sons et de phonemes a et6 
fait. 



II est clair que les enfants dyslexiques n’ont pas montrd de difficult6s 
dans r identification des elements du continuum mais cela ne signifie pas 
que les dyslexiques n’aient pas de deficit au niveau phon6tique. L’origine 
de difficultds d’acquisition du langage 6crit se situe aussi k d’autres 
niveaux : problematique visuo-spatiale, representation mal ancree des 
graphemes ou des phonemes, efficience moins grande de la memoire, 
probleme k passer d’un code k un autre, sans oublier les facteurs 
relationnels ou de motivation. La dyslexie n’etant pas un syndrome 
unitaire, une des formes se situerait peut-etre effectivement dans un 
contexte phonique et il serait bon de continuer la recherche dans cette 
voie. On pourrait, par exemple, a) tester ce meme groupe de sujets 
dyslexiques avec un continuum variant selon le lieu d’articulation ; b) leur 
faire effectuer egalement la tache de discrimination, puisque e’est dans 
celle-ci que De Weirdt (1988) a trouve les differences les plus 
significatives entre les groupes ; c) avec ce meme continuum, tester des 
enfants plus Jeunes, dont la lecture n’aurait pas encore entraine les 
capacites d’analyse phonetique ; d) etudier d’autres populations dites 
“pathologiques”, afin de verifier si effectivement certains sujets ne 
montrent pas une P.C. Quelle que soit la population etudiee, il serait 
important de tester un echantillon plus vaste, car les “cas” que Ton place 
sous la meme dtiquette sont parfois tres differents et ne presen tent done 
pas tous des difficult6s ou des deficits au meme niveau. 
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Speech Viewer I : comment on s*en sent et comment s*en servir 
Adrienne Miiher & Anne-Claude Pr6laz 



R6sum6 

Cet article pr^sente Speech Viewer I, un programme d'aide ^ la parole 
d^velopp6 par IBM. Apres une description du logiciel et de ses modules, 
nous r6sumons les r^sultats d'une enquete faite aupr^s d'une trentaine 
d'orthophonistes en Suisse Romande. Ayant constat^ que les utilisateurs ne 
profitent pas pleinement du logiciel, nous faisons une s6rie de propositions 
d'utilisation des modules en fonction d'un certain nombre de pathologies 
courantes. 

1. Introduction 

Comme toute profession, le domaine de I'orthophonie est en constante 
evolution au niveau theorique et pratique, ce qui explique que certaines 
techniques informatisees se soient ddveloppdes pour le traitement du 
langage ecrit et oral. Dans cette dtude^ nous nous sommes intdressees a 
Speech Viewer I, un programme d'aide a la parole developpe par IBM. 
Base sur la visualisation des parametres de la voix (amplitude, frequence 
fondamentale et temps), il permet, entre autres, aux personnes sourdes ou 
ayant des problemes vocaux de mieux gerer ces parametres. Notre objectif 
etait double : nous souhaitions tout d'abord foumir une evaluation critique 
de cet outil afin de permettre une dventuelle mise k jour du programme par 
la maison productrice, mais surtout nous souhaitions donner aux 
utilisateurs de nouvelles iddes d'appli cation. 

L'histoire de Speech Viewer I debute en 1978 lorsque des chercheurs 
d’lBM commencent a explorer de quelles manieres les connaissances 
actuelles dans le domaine du traitement automatique de la parole 
pourraient aider des enfants sourds dans I'apprentissage de la langue orale. 
Ils 61aborent le systeme informatis6 d'aide k la parole Vocalization qui sera 
le precurseur de Speech Viewer. Pendant dix ans le programme est teste et 
evalu6 par des professionnels du domaine de la surdite afin de permettre 



* Issue d'un travail de m^moire d'orthophonie (Muller & Pr61az, 1993). 
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aux chercheurs d’am61iorer leur outil. Les articles de Bindas (1986), 
Churan & al. (1986) et Riski (1986), par exemple, offrent un compte rendu 
de son utilisation dans divers instituts americains. Ils situent I’outil dans le 
contexte de I’institution, decrivent le type de patients avec lesquels il est 
possible de I’utiliser, le genre de travail effectue et les resultats obtenus au 
travers d’6tudes de cas. En 1989 Speech Viewer I apparait sur le marche 
europ6en et deux ans plus tard quelques 18 versions langagieres existent. 
La version 1 a deja fait I’objet dun certain nombre d'etudes : Ryalls & 
Cloutier (1991), Mahaffey (1991), Pratt & al. (1991), par exemple. 

Speech Viewer se presente sous forme d’une carte de traitement vocal 
et d’un logiciel que Ton installe sur un ordinateur IBM PS2 ou sur un IBM 
compatible (en utilisant la carte d’entr6e PS2). II fonctionne sous le 
systeme d’exploitation DOS, version 4.00 ou ult6rieure, et necessite une 
taille m6moire minimale de 640Ko. L’equipement comporte aussi un haut- 
parleur et un microphone pour I’enregistrement et la re6coute des 
productions. Les onze modules de Speech Viewer permettent de maitriser 
progressivement les principales composantes de la parole, de maniere plus 
ou moins ludique. L’orthophoniste adapte les programmes selon les 
objectifs therapeutiques en d6finissant, par exemple, le degre de 
complexite. Le patient beneficie en temps r6el d'un feed-back visuel et 
parfois auditif de remission sonore. Les diff6rents modules sont regroup6s 
en trois categories, chaque categorie comprenant un certain nombre de 
programmes particuliers qui ont pour nom I’objet que Ton voit sur r^cran : 

- La decouverte : \-Kaleidoscope (d^couverte du son), 2-Ballon 
(amplitude), 'i-Thermometre (frequence fondamentale), 4-Train (attaque 
du voisement) et 5-Clown (amplitude et voisement). Ces modules 
representent chacun une ou deux composantes acoustiques de la voix. Le 
patient en prend peu a peu conscience grace a I’interaction avec les dessins 
qu’il anime k l’6cran. Par exemple, les modules Ballon, Thermometre et 
Clown representent respectivement I'amplitude, la frequence fondamentale 
et I’opposition vois6 / non-vois6. 

- Les exercices de controle : 6-Parcours d'obstacles (controle de la 
frequence fondamentale), 1 -Relief (controle du voisement), S-Singe 
(controle d’une voyelle) et 9-Labyrinthes (controle de quatre voyelles). 
Ces exercices servent k maitriser les parametres acoustiques de la parole 
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sans qu'ils soient integr6s dans un contexte linguistique. On peut 
6galement adapter la vitesse et le niveau de tolerance du systeme pour 
assurer le succes du patient. Parmi ces modules, nous trouvons le Parcours 
d'obstacle qui exerce le controle de la frequence fondamentale en 
obligeant le locuteur a moduler la hauteur de sa voix pour suivre un 
chemin donn6 et le Relief qui conceme la tenue du voisement et la maitrise 
du souffle. 

- Les graphiques : lO’Enveloppe ou frequence, 11 -Signal vocal et 12- 
Spectre, Ce dernier groupe de modules presente des graphiques et des 
resultats statistiques. Ceux-ci permettent d'analyser les productions de 
maniere plus technique : il est possible de reecouter des mots ou des 
phrases, d’examiner des 6chantillons de parole, d'enregistrer des 
productions sur disque dur ou disquette. Ces donnees peuvent servir de 
base de comparaison au cours de 1’evolution du traitement et permettre une 
evaluation relativement objective. 

Pour notre part, nous avons trouve interessant d'etudier comment 
Speech Viewer etait utilise par les orthophonistes eux-memes. Nous avons 
done developp6 un questionnaire detaille que nous avons remis a une 
trentaine de logopedistes en Suisse Romande qui utilisent le logiciel avec 
diff6rents types de populations. Le resultat de cette enquete consiste en 
une s6rie de donnees ainsi qu'un certain nombre d'idees nouvelles pour 
I'utilisation du logiciel. 

2. M6thode 

Sujets : Trente-quatre orthophonistes, r^partis sur I'ensemble de la Suisse 
Romande, ont rdpondu au questionnaire. 

Matiriel : Le questionnaire dtait composd principalement de questions k rdponses 
libres et k dchelles et comportait les sections suivantes : informations gdndrales, 
installation, familiarisation et ddcouverte, utilisation en thdrapie, Evaluation, nouvelle 
version, conclusion. 

Procidure : Hormis sept cas, nous avons rempli le questionnaire avec les 
orthophonistes sur leur lieu de travail. 

Analyse des donnies : Chaque type de question a fait I'objet dune analyse 
diffErente (quantitative et qualitative). 
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3. R^sultats 

1. Informations g6nerales : Les utilisateurs mettent en avant 
I'attrait, la motivation et I'aspect ludique du logiciel, qualites qui sont 
d'ailleurs relev6es tout au long du questionnaire. Le fait que le logiciel ne 
soit pas un outil en soi mais un moyen compl6mentaire est egalement 
fr6quemment cit6. L'utilisation de Speech Viewer est ponctuelle avant 
tout. Elle a pour but de visualiser les param^tres vocaux travailles en 
th6rapie, en les pr6sentant sous une forme ludique et diversifi6e. Les 
limites, quant a elles, concement la reconnaissance de la parole et la 
complexity des r6glages. 

2. Installation : Dans la majorite des cas, les utilisateurs n'ont pas 
proc6dy eux-memes k I'installation de la carte informatique de Speech 
Viewer. Nous avons done mis de cote cette partie du questionnaire. 

3. Familiarisation et decouverte : La majorite des utilisateurs ont 
dans un premier temps decouvert Speech Viewer lors de demonstrations 
du logiciel ou/et de cours. D’autres se sont contentes d'utiliser le manuel et 
de decouvrir le logiciel par tatonnements, seuls ou avec des collegues. 
L'acces ^ un premier niveau de maitrise a €i€ aise et a n6cessite 
relativement peu de temps. Toute la phase d'approfondissement des 
connaissances (reglages, adaptations, lecture de certains graphiques) par 
contre, a souvent ete laissee de cote et de ce fait a limite l’utilisation du 
logiciel. Certains utilisateurs trouveraient utile d'avoir une personne de 
reference pour ce genre d'explications ou d’avoir acces k un guide plus 
detailiy ou meme un programme de demonstration. Les principales 
demandes se situent done au niveau du lien technique-clinique. 

4. Utilisation en therapie : Speech Viewer, con 9 u a la base pour les 
enfants sourds afin de remedier aux problemes d'articulation et de maitrise 
de la voix, a vu son utilisation s'^tendre. Les logopedistes s'en sont 
rapidement servi pour ces memes troubles sans surdit6 associee, puis font 
applique k des probiematiques telles que troubles d'eiocution, rhinolalie, 
dysarthries, etc. Aucun prerequis spedfique n'est necessaire pour 
l'utilisation de ce logiciel, si ce n’est un interet pour ce genre d'approche. 
Une bonne connaissance du systeme par le therapeute est cependant 
indispensable si Ton ne veut pas etre limite dans les applications. La 
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maitrise de sa propre voix n’est d'autre part pas n6gligeable ! L'enfant, 
quant a lui, se montre enthousiaste et amus6. Speech Viewer pr6sentant un 
grand attrait de par sa presentation ludique et color6e. Ne donnant pas 
toujours sens au feed-back visuel, l'enfant a parfois besoin d'une 
explication de I'adulte. 

5. Evaluation : La majorite des utilisateurs ne se servant pas de 
Speech Viewer k des fins d'^valuation, nous n'avons pas approfondi cet 
aspect. 



6. Nouvelle version : Certaines lacunes ont relevees par les 
utilisateurs. Quelques fonctions absentes etaient souhait6es : le traitement 
des consonnes (articulation), le travail du timbre, le traitement du 
nasonnement, ainsi qu'une approche des niveaux de langage plus 
complexes. Des ameliorations ont 6galement ete proposees telles que 
I'accroissement de la variate des modules et I'amelioration du traitement de 
la parole. 

Ces diff6rents souhaits ont ete exauces, en partie, avec Tarriv^e sur le 
marche en 1992 de la nouvelle version. Speech Viewer 2, qui fait suite a 
trois ans de recherche. On y trouve notamment : plus de vari6t6 dans les 
modules, la possibilite de travailler I'articulation des consonnes (sauf les 
occlusives) ainsi que I'enchainement de phonemes et de mots, une 
amelioration dans la gestion des fichiers, la possibilite d'avoir plusieurs 
versions linguistiques sur le meme programme, la presentation d’un 
spectrogramme en trois dimensions, un casque h micro, un filtre anti-bruit, 
une grille clavier adaptee aux personnes handicapees moteur, un 
eiargissement du registre des frequences traitees (->7000Hz), la 
conversion possible des signaux acoustiques en signaux optiques et un 
programme de demonstration sous forme de video. D'autres souhaits n'ont 
pas obtenu satisfaction : la baisse du prix, la simplification du fascicule, la 
vulgarisation de la technique et I'etablissement d'une progression par 
niveaux. 

Pour conclure ce tour d'horizon des avis exprimes sur Speech Viewer, 
il est interessant de faire ressortir les avantages et les inconvenients 
principaux du logiciel. Les apports les plus frequemment cites sont la 
possibilite de visualiser les phenom^nes acoustiques, I'aspect ludique du 
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logiciel et la possibilite de diversifier la th^rapie. Quant aux limites, les 
utilisateurs ont surtout releve les problfemes de reconnaissance de la 
parole, les difficultds de reglages et d utilisation des fichiers, le cout et la 
n6cessit6 de devoir maitriser Tordinateur pour que le programme soit 
performant. 

4. Nouvelles utilisations 

Les propositions que nous faisons ci-dessous sont issues aussi bien du 
questionnaire auquel ont rdpondu les logop6distes que de nos lectures et 
des suggestions ddcrites par les ddveloppeurs de Speech Viewer. Nous les 
presentons d’abord en fonction de differents paramfetres de la parole, 
class6s par ordre alphabetique, et les regroupons ensuite dans un tableau 
rdcapitulatif. Ces idees devraient permettre de nouvelles possibilites dans 
I’utilisation clinique et amener a une meilleure exploitation du logiciel. 

1 . L’accent 6tranger : La reduction de I’accent etranger peut etre 
travaill6e grace aux modules graphiques. Dans Enveloppe ou frequence on 
exerce I’opposition court/long ; les productions que Ton peut reecouter se 
font sur imitation. Dans Signal vocal, I'analyse est plus fine : on 
selectionne le segment de courbe que Ton veut reecouter et voir agrandi au 
bas de l’6cran. Enfin, grace au Spectre, le sujet peut comparer des voyelles, 
en imiter la courbe, essayer de retrouver laquelle est affichee dans telle ou 
telle couleur. En fait, cette reeducation se base surtout sur Tauto-6coute et 
sur I’observation de ses propres mecanismes de phonation. 

2. L’amplitude : Pour travailler cet aspect de l'6mission vocale, diverses 
possibilites sont offertes. Un certain seuil d’amplitude doit etre atteint pour 
animer le Kaleidoscope. Le Ballon grossit si Ton parle plus fort et la 
bouche du Clown s’agrandit dhs que I’amplitude augmente. Deux 
graphiques peuvent dgalement etre utiles : dans Enveloppe ou frequence, la 
plage d’amplitude peut etre adapt6e et il est possible ensuite de comparer la 
production de deux locuteurs. De meme, dans le Signal vocal, I'amplitude 
est affichde par rapport a la frequence fondamentale. 

3. L’attaque du voisement et I’attaque glottale : Pour maitriser I'attaque 
d’un son, qu’il soit vois6 ou non-vois6, nous avons a disposition plusieurs 
modules. Le Train (attaque du voisement) est sp6cialement con 9 u pour 
decouvrir la diff6rence entre le son lui-meme et I’attaque qui doit etre 
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toujours renouvel^e pour faire avancer le train. Quant au Relief y ou la tenue 
d’un son vois6 permet au ballon de survoler les montagnes, il amene a la 
precision de I’attaque dans le temps ; en effet, il faut pr^voir silence et 
voisement par rapport au souffle disponible. 

4. L'audition et la discrimination auditive : Etant donnde la conception 
de Speech Viewer qui veut compl6ter I’information auditive par des 
informations visuelles, la fonction auditive est active tout au long de 
I’utilisation du programme. Meme dans le travail avec des personnes 
sourdes, ce lien est present puisque Timage represente des donndes que 
Toreille ne peut percevoir, du moins pas dans leur totalite. Dans tous les 
modules du logiciel, le controle auditif des 6missions vocales est important, 
que ce soit lors de la production elle-meme ou, dans un deuxieme temps, 
pour Tanalyse et la correction en vue de la rapprocher du modele. Quel que 
soit I’exercice que Ton propose, la discrimination auditive ou plus 
gendralement l’audition, sera mise a contribution. Suivant I’objectif vis6 et 
le genre de patient, elle sera plus ou moins sollicitee. 

5. L’expression et la decouverte de la voix (bruits, parole, chant) : En 
regie generale. Speech Viewer favorise assez bien I'expression et 
I’exploration de la voix. En fait, la plupart des modules permettent cette 
decouverte : une action a lieu sur I’ecran des que Ton produit de la parole, 
du chant ou un bruit quelconque. Le choix du materiel sonore est vaste : il 
s’etend des phrases regulieres de la comptine au simple bruitage. On peut 
inventer des mots, en ddformer d’autres, jouer avec la voix et les m61odies, 
tout ceci dans un but pr6determin6 ou simplement pour decouvrir ses 
propres possibilit6s. 

6. Le mecanisme pneumophonique : On sait que le souffle est h la base 
de toute expression vocale. Le volume d’air et son debit doivent coincider 
avec I’intention du locuteur de dire quelque chose et 6galement avec la 
maniere dont il va le dire. Pour atteindre cet objectif, on peut se servir de 
Speech Viewer dans divers modules. Les deux premiers, le Kaleidoscope 
et le Balloriy permettent la confrontation avec la notion de dur6e d’un son : 
celle-ci sera plus longue si on 6conomise son souffle, elle sera restreinte si 
I’expiration se fait trop rapidement. Le patient se rend compte alors qu'il 
peut controler sa sortie d’air. Dans le module du Train, on peut travailler la 
respiration en inspirant entre les syllabes, les mots ou les bouts de phrases 

O 

ERIC 




172 Speech Viewer I 



qui font avancer le train d’un ou de plusieurs crans. Le but est d’apprendre a 
inspirer rapidement, ce que nous faisons habituellement entre deux phrases 
lorsque nous parlons. Le danger est que le patient se crispe s’il essaie de 
faire avancer le train le plus vite possible. Le Clown met en relation la 
duree du voisement avec son amplitude. On doit doser le souffle et respirer 
efficacement. Le module Parcours d'obstacle (frequence fondamentale) se 
prete k I’exercice de la tenue d’uri son lorsque le m^canisme 
pneumophonique est d^j^ bien mis en place, ceci surtout si le mobile se 
d6place sur une courbe et s’il faut maitriser la m^lodie exig^e. II s’agit 
d’essayer de traverser I’ecran avec le moins d’inspirations possible en cours 
de route. Le module Relief id^al pour exercer le dosage du souffle. On 
commence par former de petites montagnes, avec un espace relativement 
grand entre elles. Puis la montgolfi^re reste en I’air plus longtemps et les 
vall6es deviennent progress! vement plus ^troites. II est important de 
pouvoir s’adapter aux capacit^s du patient puisque I’^chec n’est pas 
encourageant. Si on desire une analyse plus precise des interactions entre 
les diff6rents parametres vocaux, on utilisera les graphiques que pr6sentent 
Enveloppe ou frequence et Signal vocal car le temps y est affich6 en meme 
temps que I’amplitude et la frequence fondamentale. On peut done observer 
les effets que pourrait avoir une des variables sur les autres. 

7. Les notions spatiales : Un seul module permet de travailler les 
notions spatiales : les Labyrinthes. Le locuteur doit d’abord associer une 
voyelle a une direction, puis se diriger vers la sortie en produisant le 
phoneme correspondant au sens dans lequel le mobile doit avancer. 

8. La prosodie : Pour travailler cet aspect du langage. Speech Viewer 
offre plusieurs possibilit6s. Dans les modules de decouverte, le Ballon et le 
Clown permettent d’obtenir des variations d’amplitude r6guli^res et 
maitris6es ou, au contraire, une production maintenue a une amplitude 
stable (son continu, phrase). Le Thermometre quant a lui illustre les valeurs 
de Fo qu’atteignent respectivement les voix de femme, d’enfant et 
d’homme. Le Train est utile lorsque Ton s’int^resse au rythme prosodique. 
A I’aide d’une phrase dans laquelle consonnes sourdes et ponctuation sont 
r^parties de maniere homog^ne, on s’exerce k un d6bit r6gulier. Le but est 
atteint si le train rejoint la gare dans les temps fix6s a I’avance. Le 
Parcours d'obstacles a 6i6 ct66 dans le but d’exercer les modulations dans 
la hauteur de la voix. Le patient suit des chemins toujours plus difficiles 
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avec des sons isol6s, des m61odies, des phrases chant6es ou parl6es. II 
prend conscience des possibilites de sa voix a acquerir un relief qui la rend 
plus attrayante. Ce module offre le grand avantage de pouvoir cr6er des 
parcours individualises, adapt6s aux possibilit6s de chaque personne. Les 
deux modules graphiques Enveloppe ou frequence et Signal vocal 
permettent de d6velopper la prosodie. On illustre la forme interrogative par 
rapport a I’affirmative ; on montre la diff6rence entre quelqu’un qui parle 
d’une voix monotone ou d’une voix chantante. L'exercice peut se faire sur 
imitation, en lecture, ou en laissant deviner k Tautre quel genre de phrase 
est affichee k l’6cran. 

9. La realisation de phonemes : Malgr6 le fait que Ton se heurte parfois 
a des limites techniques (reconnaissance de parole surtout), les possibilites 
dans ce domaine sont nombreuses. Si on considere I’intelligibilite et la 
qualite de la prononciation, on peut utiliser un certain nombre de modules. 
Le Clown sert a bien distinguer les sourdes des sonores dans le groupe des 
consonnes. Enveloppe ou frequence et Signal vocal concement tous les 
phonemes, tandis que le dernier module, le Spectre, est tres utile pour les 
voyelles et les diphtongues. Le Kaleidoscope peut etre utilise pour 
travailler Tarticulation, mais il n’apporte pas d'information precise sur telle 
ou telle caract6ristique du phoneme, mis a part la presence du voisement. 
Dans la r6alisation des consonnes, Taspect probl6matique est souvent 
I'opposition vois6/non-voise. Les paires de constrictives et d'occlusives 
sont bien represent6es par le Clown. Ce module est indiqu6 pour la 
differenciation sourde/sonore, et surtout pour les fricatives qui peuvent etre 
6mises sur une duree plus ou moins longue, par opposition aux occlusives 
qu’il est difficile de ne pas faire suivre d’une voyelle, ce qui fausse I’image. 
Par exemple : /tae/ pour /t/ fait apparaitre les points rouges du voisement. 
Les deux premiers modules graphiques sont egalement la pour montrer et 
analyser les differences, soit entre deux phonemes (exemple : prononcer 
A>a/ puis /pa/), soit entre deux locuteurs qui produisent la meme suite 
phon6mique. 

En ce qui conceme les voyelles, on peut analyser leur composition 
spectrale respective et leur place dans la suite sonore (influence des sons 
voisins) grace aux trois modules graphiques. On peut 6galement s’exercer a 
les realiser les plus pres possible du modele a I'aide du Singe et des 
Labyrinthes. Pour cela, on peut soit utiliser comme cible les voyelles 
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pr6sent6es par Speech Viewer soit en cr6er soi-meme. Cette demiere 
solution a comme avantage de pouvoir s'adapter k un accent specifique. 
Quant au problfeme de la nasalisation de phonemes oraux, ou inversement 
de I'oralisation de voyelles nasales, il est possible de le travailler en pla 9 ant 
horizontalement une feuille cartonnde entre le nez et la bouche. On fait 
alors prononcer les voyelles concemdes en tenant le micro soit en dessus, 
soit en dessous du carton et on constate ainsi si le passage d'air est addquat. 
Les Labyrinthes mettent egalement en Evidence la nasalite. Pour 
I'apprentissage des diphtongues, on peut figer le Spectre du debut et celui 
de la fin du phoneme puis montrer le passage de I'un a I'autre grace au 
spectre dynamique. 

10. Le rythme : Ceci est un element important pour la comprehension 
du langage oral puisqu'il permet de decomposer les phrases et les mots en 
unites significatives. II peut aussi servir de support dans une reeducation 
d'un begaiement. Avec le Ballon et le Clown, on peut s'exercer a faire 
grossir le ballon et la bouche du clown en rythme, soit par altemance 
voisement/silence, soit par un son continu dont I’amplitude croit et decroit 
regulierement. Avec le Train, toutes sortes de sequences de rythmes 
peuvent etre executees, mais il faut etre attentif a ne pas crisper le larynx 
ou d'autres muscles pendant la phonation. De meme qu'avec le Relief ou le 
parcours laisse en plus une trace visible des erreurs commises. Les deux 
premiers modules graphiques donnent encore une autre representation du 
rythme. 

11. Le voisement, le chuchotement et le silence : Nous avons deja 
aborde le parametre voisement en decrivant le travail sur les consonnes. Si 
on se centre sur le voisement en lui-meme, par opposition au silence ou a 
un son non-voise, trois autres modules peuvent etre utilises. Le Train qui 
permet de se rendre compte si le voisement est continu (le mobile 
n'avancera alors pas). Les Parcours d'obstacles illustrent le fait que la 
notion de hauteur (frequence fondamentale) ne conceme que les sons 
vois6s, et que pour faire avancer, monter ou descendre le mobile, les 
cordes vocales doivent vibrer. De meme, le ballon du Relief reagit selon 
qu'il y a voisement ou silence. 

Nous proposons k la page suivante un tableau qui presente les aspects 
de diverses pathologies que Ton peut traiter a I'aide de Speech Viewer. 
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Les aspects sent sur Taxe vertical et les modules sur Taxe horizontal. Quant 
aux pathologies, repr6sent6es par un chiffre, elles sont au nombre de huit : 
dysarthries (1), troubles de T^locution (2), troubles de la voix (3), troubles 
auditifs (4), mutisme (5), hyper-nasalit6 (6), apraxies (7) et accent Stranger 
(8). D’autres suggestions tir6es des fiches modules (voir Muller & Pr61az, 
1993) sont repr6sentees par une ast6risque (*). L’utilisation d'un autre 
instrument propose par IBM ("accelerometer") est signalee par le ("). Ce 
tableau peut etre consult^ selon trois axes. Le premier se base sur la 
pathologie (chiffres). Pour un enfant sourd, par exemple, on reperera 
facilement avec le chiffre 4 les param^tres h travailler ainsi que les 
modules qui permettent de le faire. Les deux autres axes, decrits 
pr6cedemment, permettent une diversification des applications a partir des 
modules ou encore des aspects problematiques. 

5. Conclusion 

Certains passages de cet article peuvent paraitre un peu herm6tiques 
aux lecteurs non initios. II est vrai que ces quelques pages, ainsi que le 
memoire qui en est la source, n'ont d’interet r6el que si Ton a la possibility 
d’utiliser le programme Speech Viewer. Faute de pouvoir apporter une aide 
technique directe aux utilisateurs, nous avons tente d’en montrer la richesse 
et la diversity afin de susciter I’intyret nycessaire h. Fapprofondissement de 
certains domaines. Les modifications apportyes dans Speech Viewer 2 
(voir plus haut) devraient rypondre a certaines attentes. Mais en attendant 
I'acquisition de cette nouvelle version, il serait souhaitable de ne pas se 
laisser limiter par des problemes techniques et d’exploiter au maximum un 
logiciel dyja tres performant. 
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Abstract 



We present a parser based on Lexical Functional Grammar (LFG) that 
is capable of detecting and correcting errors produced by English native 
speakers when writing in French. The errors are syntactic and morph o- 
syntactic in nature such as subject-verb and past participle agreement, 
adjective-noun word order, use of subjunctive in subordinate clauses, etc. 

The system processes a text sequentially, sentence by sentence, and the error- 
tolerant LFG parser can process any number of errors in the same sentence. A 
first evaluation shows that the system can correct some 70% of the errors in a 
small corpus. 

1. Introduction 

During the last decade, much effort has been put into developing 
computer programs that can correct errors in written text. Examples of 
such programs are the spell checkers that equip virtually every word 
processing software. If these programs seem to satisfy a very large 
number of users writing in their native language, this is not the case for 
those who need to write in a second language. For example, non-native 
writers of French or German make the common mistake of using the 
wrong gender with articles or adjectives. To help them detect, and 
possibly correct, this type of error, a program operating with a different 
type of knowledge is needed. 

2. Background 

A large variety of error detection and correction tools have been 
developed for English as a first language. They range from spell checkers 
that generate word alternatives using phonological rules to style checkers 
based on stylistic theory (Payette, 1990). One of the most advanced 
examples of such tools is the commercial product Correct Grammar. It 
performs a complete parse of each sentence using mechanisms that 
analyze even complex text structures, abbreviations, quotation marks, etc. 
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However, even if Correct Grammar represents quite an achievement, its 
usefulness is still questionable (Dobrin, 1990). Some grammar rules 
implemented in Correct Grammar are not normally observed by users, 
simply because they have different writing styles, whereas other rules are 
irrelevant because they are never broken. 

The situation in the area of second language correction is not as 
developed as in first language checking. Although linguistic research in 
contrastive analysis and more recently in interlanguage theory (Corder, 
1967; Selinker, 1972; Richards, 1972; Flynn, 1988) has produced many 
good descriptions and classifications of second language errors, little has 
been done to implement tools that will detect and correct these errors. 

3. System Description 

The aim of our research is to study the mechanisms involved in 
dealing with errors occurring specifically at the levels of syntax and 
morpho- syntax. To achieve this, we have implemented a parser based on 
Lexical Functional Grammar (Bresnan, 1982), later referred to as LFG. 
This parser is capable of detecting and correcting errors in written 
French produced by English native speakers. The errors that are 
processed fall into the following domains: subject-verb agreement, 
adjective-noun word order, noun phrase agreement, past participle rule, 
use of the subjunctive in subordinate clauses, subcategorization of selected 
verbs and usage of d, am, auXy du and des. 

The system processes a text sequentially, sentence by sentence, and 
displays warning messages and suggestions for corrections when it detects 
an error. The system's error-tolerant LFG parser allows it to process any 
number of errors in the same sentence or sentence segment. It should be 
noted that we have put little emphasis on the interaction with the user, as 
the purpose of our research was to investigate the feasibility of using 
LFG as a basis for automatic error processing rather than to develop a 
ready-to-use second language writing tool. 

4. Error detection using LFG 

In LFG, the grammatical relations between words are encoded in 
functional structures ("f-structures"), which consist of ordered attribute- 
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value pairs. LFG imposes three grammaticality conditions on the contents 
of functional structures: uniqueness, coherence and completeness. The 
uniqueness condition specifies that an attribute in an f-structure may have 
at most one value. For example, the attribute number may not be 
’singular’ and ’plural’ at the same time. The coherence and completeness 
conditions apply to the subcategorization arguments of verbs and nouns. 
Together they impose a one-to-one correspondence between the functions 
present in an f-structure and the subcategorization list of the head of the 
f-structure. 

The error detection mechanism of our system relies solely on these 
grammaticality conditions. The following examples show how each one is 
used. 

1- Uniqueness 

LFG theory uses common attributes such as ’gender’, ’number’, 
’person’ and ’case’ to impose certain constraints on the text. One way to 
add constraints, and thus to detect additional errors, is to insert additional 
attributes. For example, this can be done to check the use of prepositions 
de and d in sentences such as // me permet de partir (He allows me to 
leave) and II m'autorise d partir (He authorizes me to leave). The 
following conditions are attached to the lexical entries of the above 
examples: 

permet (Tcomp-prep) = prep-de 

autorise (Tcomp-prep) = prep -a 

de (Tcomp-prep) = prep-de 

d (Tcomp-prep) = prep-a 

These force the use of the preposition de with permet and d with 
autorise in the same way that the attributes ’number’ and ’person’ ensure 
the proper subject-verb agreement. However, this approach is insufficient 
in more complicated cases: the past participle rule in French is a typical 
example where conditions apply at more than one level. The gender and 
number of the past participle depend, amongst other things, on which 
auxiliary verb is used {etre or avoir), on the position of the direct object 
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relative to the verb and on the gender and number of the subject or the 
direct object. In this case, the solution consists in adding not just one 
attribute to a lexical entry but a series of if-then rules that insert the 
correct constraints in the f-structure. Consider the sentence // les a 
achetes hier (He bought them yesterday). The lexical entries for achetes 
and a are as follows: 

achetes (tnumber) = plural 

(Tgender) = masculine 

a if (tobj position) is after-verb 

then (tnumber) = singular 
(tgender) = masculine 
else (tnumber) = (tobj number) 

(tgender) = (tobj gender) 

(If the direct object is placed after the verb, the past participle is 
masculine singular, but if it is placed before the verb, as is the case in our 
example, the past participle takes the number and gender of the direct 
object.) 

The value for the attribute 'position' is inserted in the f-structure by 
the phrase structure rule that was instantiated at the verb phrase level. 
The following simplified example shows how this is done: 

VP :==> V NP PP 

(tobj)= i (Tobj2)= i 
(Tobj position) 

= after-verb 

This mechanism appears in all situations where the order of sentence 
components is important, as when you have to indicate whether an 
adjective precedes or follows the noun in a noun phrase. 

2- Coherence and completehess 

Some verbs, such as telephoner (to phone) and donner (to give), cause 
a lot of confusion among English native speakers writing in French as 
their complements are constructed differently in the two languages. In 
English, you phone someone whereas in French you phone to someone 
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(telephoner d quelqu'un). This is obviously a case where, if the wrong 
construction is used, both the coherence and the completeness conditions 
are violated. Because of the large number of different phrasal 
constructions that arise in everyday texts, it would be unreasonable to flag 
an error every time one of these two conditions failed. Thus, instead of 
storing a comprehensive set of complement combinations, the system only 
flags an error when a specific situation occurs, such as: 

IF the coherence or/and the completeness condition is not satisfied 
AND the verb in question is a member of a specific list of misleading 
verbs 

AND a specific combination of complements occurs 
THEN an error is detected. 

For the verb telephoner y for example, an error is indicated only if a 
direct object is found in the f-structure instead of an indirect object. If the 
coherence or the completeness conditions fail for a verb not in the list, no 
action is taken. 

5. Organization of the program 

The central elements used for error detection and correction are the 
f-structures representing the input text. These are generated by an error- 
tolerant parser that produces one f-structure for each interpretation of the 
text and, at the end, discards all f-structures but one. The error 
correction stage then checks this f-structure for inconsistencies, 
determines the cause of the errors it may contain and corrects these when 
possible. 

5.1. Error-tolerant parsing 

Standard LFG parsers usually build f-structures in parallel with 
phrase structure trees called constituent structures ("c-structures"), so as 
to control the explosion of the number of solutions (Block and Hunze, 
1986). With such methods, partial f-structures are discarded during 
parsing as soon as one of the grammaticality conditions fails. A different 
approach is necessary when the text contains errors (as in our case) as the 
grammaticality conditions fail for every single solution and no f-structure 
can be produced. Another difficulty encountered at this stage is that only 
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a few sentences can be fully parsed using today's methods. The presence 
of errors only amplifies this situation. In order to contain these problems, 
we have divided the parsing stage into two steps: 

Step 1 - Construction of c-structures and segmentation 

A chart parser is used to apply phrase structure rules to the text. If no 
complete c-structure can be created, a segmentation algorithm extracts 
islands from the chart (usually noun phrases and verb phrases) which can 
be processed separately. 

Step 2 - Unification 

Instead of discarding the f-structures that contain inconsistencies, the 
unification algorithm maintains a list of each attribute's values and their 
source, which can be a lexical item or a c-structure node equation. An 
error is recorded as soon as a list contains two different values, i.e. when 
the uniqueness condition is not satisfied. The coherence and completeness 
conditions are only checked after the f-structures have been built 
completely. 

The final operation executed at this stage consists in counting the 
errors in each f-structure. Only the one with the fewest errors is kept and 
corrected. 

5.2. Error processing 

Given the f-structure produced by the parser, the goal of the error 
correction stage is to put the input text into grammatical form. When this 
is not possible, the error corrector produces a warning message without 
proposing a correct form. Regardless of the nature of the error in the 
text, each error is represented in the f-structure either by an attribute 
with ambiguous values or by a PRED attribute for which the 
subcategorization arguments do not match. Thus, instead of processing 
the text word by word, the error processing mechanism executes one 
complete correction procedure for each flagged attribute. Because every 
attribute is subject to having ambiguous values, one procedure is attached 
to every single attribute used by the grammar. 
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The behavior of the correction procedures varies according to the 
type of errors covered. 

5.2.1. Ambiguous attributes related to morphological elements 

Morphological errors occur, for example, when the gender of an 
article or an adjective is wrong, or when the verb is at the wrong person 
or at the wrong mode. Most error correction systems in this case only 
give a warning message to indicate the noun phrase or sentence fragment 
in which the error occurred. We have gone one step further in that the 
wrong words are actually corrected and replaced in the text. But this 
approach requires more information than what is usually encoded in the 
lexicon. 

Consider the following two examples: 

(a) * Le maison (the house) (b) * Les maison (the houses) 

In (a) the gender of the article should be feminine instead of 
masculine, and in (b) the number of the noun should be plural. In both 
cases, the data in the f-structure only indicate a mismatch between the 
values of one attribute. To fill this gap, the error corrector uses a set of 
lexical rules to decide which value to select. Here are extracts of such 
rules: 

- The gender of nouns takes precedence. 

- The number of articles takes precedence. 

- The past participle number and gender introduced by the auxiliary 

verb take precedence. 

Given this information, the error correction procedures for 
morphological attributes execute the following operations: 

(1) Find the reference value of the attribute. 

(2) Find all the words tljat have a different value for this attribute. 

(3) Search the lexicon for the new word form. 

(4) Edit the text or show the new word. 




188 Automatic correction of French prose 



In example (a) above (*Le maison), the ambiguous attribute is 
’gender'. Step (1) finds that the reference value is that of the noun, 
maison. Step (2) identifies that the article has a different value. Step (3) 
looks for the feminine equivalent of le in the lexicon and finds la. 
Finally, step (4) replaces le with la. 

The same mechanism is also used to verify the past participle rule. 
The if-then rule shown for the auxiliary avoir in section 4 above 
introduces reference values for gender and number, and if they don’t 
match the values of the past participle, the lexicon is accessed in order to 
find the new word. 

5.2.2. Ambiguous attributes not related to morphological 
elements 

The case of ambiguous attributes not related to morphological errors 
is similar to the previous one in that a reference value for the attribute is 
present, as in *// me permet d partir (He allows me to leave). Here, the 
attribute ’comp-prep' received the wrong value 'prep-a' from the word d 
instead of ’prep-de’, which is the reference value obtained from 
permettre. In such cases, the correction procedure simply displays a 
warning message indicating that the main verb requires the preposition 
de. 

5.2.3. Subcategorization errors 

As mentioned earlier, the procedures attached to subcategorization 
errors only check for specific conditions to be present in the f-structure. 
The following example shows how the subcategorization for the verb 
telephoner is verified. 



IF 


pred = telephoner THEN 


IF 


obj is present 


AND 


obj2 is not present 


THEN 


print a warning message of the type 
"use telephoner d guelgu'un " 



In all other cases, no action is taken. 



ERLC 
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This basic correction method can be improved somewhat when the 
direct object is a pronoun, as in the sentence * II la telephone (He calls 
her). A check for a pronoun can be added in the list of conditions, and the 
method used for morphological attributes (finding the reference value) 
can be applied to replace the accusative form of the pronoun with the 
dative {lui). 

6. Evaluation 

The aim behind the evaluation we conducted was to determine the 
extent to which LFG-based algorithms could be used in second language 
error correction systems. The corpus we used consisted of 165 sentences 
obtained mainly from grammar books for learners of French and 
illustrating the problems related to each of our 11 error categories. Two 
thirds of the sentences contained an error, the others were grammatically 
correct. 

The error categories were the following: 

1. Subject- verb agreement 

2. Noun phrase agreement 

3. Confusion between infinitive and past participle 

4. Past participle rule with etre 

5. Past participle rule with avoir 

6. Use of subjunctive in subordinate clauses 

7. Subcategorization of verbs 

8. Adjective-noun word order 

9. Use of prepositions de and a with infinitive verbs 

10. Confusion between a and a 

11. Use of d, au, aux, du and des (preposition+article) 

Our corpus was preferred to a set of 'real' texts (such as essays, 
translations or reports written in French by native speakers of English) 
because we did not have a lexicon or a set of grammar rules to cover such 
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texts. Also, the removal of the many errors that were not dealt with by 
our system was not considered to be appropriate. In addition, some of our 
error categories may have occurred infrequently. 

In order to ensure an objective evaluation, the LFG lexicon was built 
out of context: the test sentences were segmented into words which were 
then sorted into alphabetical order before being inserted in the lexicon. 
The sentences themselves remained hidden until they were submitted to 
the system. 

The results of the evaluation for each category of errors were the 
following: 



category 


hit 


incorrect 

detection 


miss 


false 

alarm 


1. S-V agreement 


7 


- 


3 


1 


2. NP agreement 


8 


1 


1 


5 


3. PP vs. inf. 


10 


- 


- 


8 


4. PP etre 


6 


2 


2 


- 


5. PP avoir 


8 


- 


2 


- 


6. subjunctive 


4 


- 


6 


• 


7. subcateg. 


2 


1 


7 


2 


8. adj. position 


10 


- 


- 


2 


9. prep + inf. 


6 


- 


4 


1 


10. a vs. a 


8 


1 


1 


1 


11. prep + art. 


8 


- 


2 


- 


total 


77 

(70%) 


5 

(4.5%) 


28 

(25.5%) 


20 



Table I - Results for each error category 
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Out of the 77 hits, 18 (23%) were warnings and 59 (77%) were 
corrections (the system gave the proper form of the word to replace or to 
add in the text). As we can see from the results, some error categories are 
characterized by a high hit rate and a low number of false alarms. Among 
these, the success of categories 8 (adj. position) and 1 1 (prep+art) can be 
largely attributed to the simplicity of the test sentences. A simple pattern 
matching scheme checking for word pairs would have detected most, if 
not all, of these errors. Two other categories, 5 (FF-avoir) and 10 (a vs. 
d), are good examples of cases where the advanced grammatical 
formalism was used to its full extent. 



Two error categories, numbers 2 (NP agreement) and 3 (PP vs. 
infinitive), are characterized by a high hit rate but also generated a large 
number of false alarms (13 false alarms altogether). They show what can 
happen when the error detection mechanism is too loose. Adding 
detection constraints would reduce the number of false alarms but would 
also result in fewer detections, which would in turn considerably lower 
the overall performance of the system. 

Finally, some error categories are characterized by a low hit rate. 
Categories 6 (subjunctive) and 7 (subcateg) are examples where our 
system did not possess the information required to handle the very 
specific situations in which these errors occurred. 

Another way to look at the results is to use the glass box approach 
(Palmer and Finin, 1990) where the goal is to determine the behavior of 
the individual components of the system. In order to achieve this, we have 
divided the error detection and correction process into four steps and 
counted how many of the 53 system failures (incorrect detections, misses 
and false alarms) could be attributed to each one. 



We determined that 50 of the 53 failures (94%) were caused by 
insufficient or inadequate information either in the lexicon (26 cases, 
49%) or in the syntactical rules that are used to build the c-structures (24 
cases, 45%). Consider the following examples: 

a. * Avoir connus des etrangers est important. 

(To have known strangers is important) 
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b. * Je suis content qu'elle vient. 

(I am happy that she is coming) 

In (a), the system did not recognize the past infinitive (avoir connu). 
Not only did it fail to detect the error in connusy but it also generated two 
false alarms when it suggested to replace est with sont and to add an ’s’ to 
important. In (b), the lexicon did not contain any rule specifying that the 
expression etre content required the subjunctive. In the other 3 failures, 2 
were due to problems in the selection of the ’best’ f-structure (the one 
that has the least number of errors) and only 1 was caused by an 
inappropriate correction rule. In this latter case, *cette homme was 
replaced with *ce homme. 

These observations show that the algorithms used in the system need 
complete linguistic data in order to perform well. If we added the missing 
information, we could expect the performance of the system to improve 
significantly on the given set of test sentences. There are several problems 
with this approach however: 

1- Modifying the lexicon may produce other false alarms or misses. 

2- A different set of test sentences could unveil other weaknesses in the 
lexicon or the grammar rules. 

3- The system’s memory and execution time are reaching their limits. 
Adding more data would require that we adapt some algorithms, thus 
modifying the behavior of the system (not necessarily for the better). 

7. Conclusions 

An advantage of using a parser based on LFG is that most of the 
grammatical rules, such as subject-verb agreement, do not have to be 
specified explicitly in the program’s database. Verifying these rules is 
done indirectly by applying the well-formedness conditions to f- 
structures. The use of a modem grammatical fonnalism also allows the 
detection of complicated cases, such as the past participle mle and the 
subjunctive in relative clauses. On the other hand, the data explosion that 
the system still experiences prevents it from processing long and 
complicated sentences. We assume that this phenomenon could be 
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controlled to some extent by comparing and discarding partial solutions 
during the earlier parsing stage. The evaluation of the system has shown 
that the algorithms work quite well but that the major bottleneck lies in 
the amount of lexical and syntactical information needed to create the 
structures on which the detection and correction algorithms are based. 
This is a major drawback if we want to use an LFG-type grammar in a 
commercial application. 

We have only demonstrated how sentences containing no more than a 
single error of a predefined type are handled. But if we consider the 
large number of spelling, lexical and semantic errors usually contained in 
texts, we can only assume that the system presented here would be just 
one element of a general error correction program. How the necessary 
interaction between our LFG-based algorithms and the other components 
would occur has yet to be determined. 
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Evaluating second language grammar checkers ^ 
Cornelia Tschichold 

Abstract 

Different aspects of an evaluation of grammar checkers for non-native 
speakers are presented. They include extra-linguistic topics such as user- 
friendliness as well as various linguistic aspects. The importance of using 
’’authentic" (i.e. second language) text material is emphasized. The point of 
view of a potential user is proposed as a strategy for designing and selecting 
appropriate test material to be used in an evaluation kit. 

1. Introduction 

This article is a short summary of the "Lizentiatsarbeit" I wrote in 
1991. Its topic was the evaluation of bilingual grammar checkers and 
comprised a ready-made kit that could be used by potential users to 
evaluate and compare grammar checkers. A black-box approach to 
evaluation was used, i.e. an evaluation where the internal functioning of 
the tool is not examined; only performance observable from a user's 
point of view is tested. 

Grammar and style checkers have been developed as a step forward 
from spelling checkers now available for most word-processing software. 
They claim that they can detect the most frequent grammatical and 
stylistic errors made by native speakers. In particular, bilingual grammar 
checkers are supposed to find typical interference errors made by non- 
native speakers. Over the last few years, several such bilingual checkers, 
mostly for English texts, have appeared on the market. They are 
relatively inexpensive programs and are therefore only rarely evaluated 
in more than informal articles in computer magazines. 

Evaluation of software tools can be defined as the comparison of the 
actual behavior of the evaluated tool with the requirements of the poten- 
tial users (Guida & Mauri, 1986). However, evaluation of NLP (natural 
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language processing) systems is hampered by the facts that, on the one 
hand, there are no formal criteria for measuring the deviations between 
the requirements and the performance, and, on the other hand, only 
samples can be used for the testing procedure due to the nature of natural 
language. There is, however, no general agreement about the 
establishment of such sample sets (Palmer & Finin, 1990). Another 
problem is simply the lack of a formal standard relating to the 
requirements for such software programs. 

Evaluation of grammar checkers is further complicated by the basic 
conflict inherent in grammar checking formalisms. Parsing relies on 
correct structures and therefore violations of these grammatical 
structures would normally lead to a failure of the overall parse 
(Thurmair, 1990). But this does not necessarily help the user find the 
error in the sentence. Nevertheless, I believe that it is possible to arrive at 
a meaningful statement on the usefulness of grammar checkers if the 
point of view of a potential user is adopted and if as many as possible of 
the relevant aspects are tested and compared to the user's needs, even if 
relatively informal criteria are used. Such an evaluation will not be 
independently valid, but can serve as a comparison of different tools. 

An evaluation should judge not only the purely linguistic capacities of 
a grammar checker to detect and correct errors in a text but also the use- 
fulness of such a product on a wider scale. Consequently, non-linguistic 
considerations such as compatibility and user-friendliness become more 
relevant. Linguistic aspects should include not only the actual correcting 
capacity of the tool but also on-line references that can help the user with 
specific grammatical points or vocabulary problems. Such on-line 
references can be very useful during the writing process and during 
correction as today's grammar checkers are still far from being perfect. 
Finally, an evaluation procedure for such a relatively inexpensive 
program should be simple and not too time-consuming to perform. 

2. Extra-linguistic aspects 

One of the primary aspects of a software program f<j>r potential users 
is compatibility with their own equipment and software. In the case of 
grammar checkers, this mainly concerns the operating System and word 
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processor already in use. A grammar checker that is not compatible with 
the user’s word processing software is obviously at a strong disadvantage 
compared to a program that works with (or within) his or her usual word 
processor and is able to cope with and preserve the formatting 
information already there. 

The other non-linguistic aspect is user-friendliness in a broad sense. 
This is an important point as a grammar checker is a product intended for 
a fairly general group of users. The program should be easy to install and 
use, and be robust against unscheduled user inputs. Speed, visual 
appearance, and the quality of the editing facilities should also be 
assessed. This can be done by using simple scales to evaluate personal 
impression. Finally, the messages that the grammar checker gives when 
an error is found should preferably be in the user's first language and 
also be meaningful to those who have neither a linguistic nor a computer 
science background. Messages should be polite and provide enough 
information about the error to allow the user to understand the nature of 
the error and then to take a decision on its correction. 

3. Linguistic aspects 

The linguistic aspects of a grammar checker can be divided into the 
actual error detection and correction facilities and the on-line reference 
options offered, such as dictionaries and grammars. Such on-line lan- 
guage tools are intended to help the user during the writing process, but 
should also be readily available during correction. They can be evaluated 
for content, for completeness (as compared to paper dictionaries and 
grammars), for easy accessibility and input error tolerance, for updating 
options and for general user-friendliness, including visual appearance and 
speed. A user-friendly look-up function for a thesaurus, for example, 
would include automatic morphological changes, e.g. a verb in the past 
tense could be replaced with the past tense of another verb if the user 
chooses to replace that verb with a synonym found in the thesaurus. 
Similarly, the correct article "a" or "an” would be automatically chosen 
before the following noun or its adjective. 

Once the text has been written, the core of the grammar checker 
comes into action. For a bilingual grammar checker, there are more 
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linguistic aspects to take into account than for a monolingual checker. 
Users make more errors, and more varied ones, when they write a text in 
their second language. Some of these errors are influenced by the 
structure of their native language. Ideally a bilingual tool should 
therefore be able to deal with the many types of errors that occur in 
written text. These include: 

- punctuation 

- spelling 

- morphology 

- syntax 

- lexicon 

- style 

Within each of these error categories, the user's native language 
should be taken into account both in detection and in the proposed 
correction(s). Above all, a bilingual grammar checker should be capable 
of detecting at least those errors that are most frequent for a particular 
pair of languages. The fact that a grammar checker can correct an error 
the user is not ever likely to make may be impressive, but it is not very 
helpful to users. This and the fact that users will have varying levels of 
knowledge of English and differing preferences concerning points of 
grammar are reason enough for the program to have an option that lets 
the user turn off those checks not needed. In addition, turning off certain 
checks can be used as a less than ideal solution to the problem of 
overflagging! 

In a black-box evaluation, linguistic testing is carried out using texts 
containing various errors that are run through the grammar checker. As 
we are dealing with natural language, it is obviously impossible to test 
every error in every possible context; we therefore have to work with 
samples of texts. The problem that arises here is the selection of test 
sentences. They should include different classes of errors but also similar 
errors in varying contexts. Furthermore, the chosen texts should 
correspond to the type of evaluation being done. The users' level of 
English, their native language, and the style they prefer to use should be 
taken into account. Therefore, one of the best solutions seems to be to 



* The increase was 4.8 % . 

* adress 

* Reactions will be more strong . 

* I would have never dreamt of this. 

* Some afraid people ran away. 

? You can sav good-bve to your business. 
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choose ”real“ texts containing typical errors. If required, these can be 
complemented by constructed sentences to test specific features. 

Using authentic texts in an evaluation of bilingual grammar checkers 
has several advantages. Very often there is more than one error in a 
single sentence, and these can influence each other to a point where the 
grammar checker is at a total loss. Furthermore, the problem of taking 
into account the exact frequency of certain error types can be bypassed to 
a certain extent with this approach. Such a procedure also helps to 
pinpoint the particular weaknesses of these tools, e.g. their inability to 
deal with lexical choice, which is a particularly important point for non- 
native writers. 

An evaluation of the detection process should include the number and 
type of wrong detections. The importance of this "overflagging" should 
not be underestimated. Non-natives are naturally less sure of their 
language skills and therefore more prone to be thrown into doubt by an 
unclear or wrong message. These superfluous messages are both 
confusing and make the grammar checking process much more time- 
consuming for the user. An adequate number of penalty points should 
therefore be given for every wrong message. In the 50-page kit compiled 
for my "Lizentiatsarbeit", the following six-part classification for error 
messages is proposed. 





Flag 


No flag 


Detection 

(DF) 


Warning 

(WF) 


(nF) 


Error 


Case 1 


Case 2 


Case 3 


No error 


Case 4 


Case 5 


Case 6 
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The first three cases are applicable if there is an error in the text. 

Case 1 represents the ideal situation: An error is detected and 
the message adequately describes the problem and proposes an 
acceptable solution. 

Case 2 occurs when the error is found but the message includes 
restrictions, e.g., "If this word is a noun, then..,". Such a 
warning message should enable the user to solve the problem. 

Case 3 applies when the grammar checker misses an error in 
the text. 

Grammar checkers also issue error messages and warnings if there is 
no error in the text (overflagging). In this context, the following three 
cases can be distinguished: 

Case 4 represents the worst case: The grammar checker detects 
an error where there is none. 

Case 5 is slightly less disastrous than the above because the 
message only gives a warning that should enable the user to rule 
out the error described in the message. 

Case 6 is applicable when there is no error in the text and no 
flag is produced. 

This classification is quite simple and computational linguists and tool 
designers may want to use finer distinctions. However, it seems easy 
enough to handle for inexperienced users. As some grammar and style 
checkers never issue detection flags but simply give warnings and 
statements of caution, cases 1 and 4 could be omitted or used only for 
spelling errors. 

Here are some examples. The first three each contain one error which 
is underlined, 

/ come to visile you. 

Message: spelling error Detection flag (DF) Case 1 




r* 

-a. 
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A sheriff s wife is married with the law. 

Message: This preposition may 

be wrong or superfluous. Warning flag (WF) Case 2 



I have selected those which apply for this story. 

No message No flag (nF) Case 3 



The following examples are correct and should not provoke any flags. 

on the ] 5th of March 

Message: capitalization 

error (th ) detected Detection flag (DF) Case 4 



I have decided to go. 

Message: Warning: "to decide" 

is a false friend. Warning flag (WF) Case 5 



I have decided to go. 
No message 



No flag (nF) Case 6 



On the following page we present an extract of a text written by a 
French native speaker. It shows how the error message classification can 
be used for continuous texts. The same classification can be applied to 
individual sentences where more specific errors are tested. The six 
possible cases are given next to each error and are represented by a 
number. The evaluator simply has to circle the number that corresponds 
to what the checker does for that error. 
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Error 






No error 




DF 


WF 


nF 


DF 


WF 


nF 


But in 1992, the fact that some people are 
afraid of the loss of our neutrality risks to 
(risks 0) 


1 


2 


3 


4 


5 


6 


preventing us to realize ffrom realizing) our 
professional ambition. 


1 


2 


3 


4 


5 


6 


An other f Another) 


1 


2 


3 


4 


5 


6 


problem could be brought by (caused) 


1 


2 


3 


4 


5 


6 


the geographical place of Switzerland in the 
middle of Europe. If the Swiss Government 
still refuses the oassaee f transit) 


1 


2 


3 


4 


5 


6 


of lorries of more than 40 tones ftons) 


1 


2 


3 


4 


5 


6 


across the land (country), 


1 


2 


3 


4 


5 


6 


the European Government could simply stop 
the negotiations fnegotiations) 


1 


2 


3 


4 


5 


6 


leads with us on other fields: fo with us in) 


1 


2 


3 


4 


5 


6 


Europe can introduce a lot of little obstacles 
towards us ffor) 


1 


2 


3 


4 


5 


6 


what could (which) 


1 


2 


3 


4 


5 


6 


destroy our economic feconomv) 


1 


2 


3 


4 


5 


6 


bv preventing us to export ffrom exporting) 


1 


2 


3 


4 


5 


6 


our production by the introduction of technical 
norms or bv taxes on exportation, for 
example, (exports) 


1 


2 


3 


4 


5 


6 


TEXT TOTAL: 















The number of occurrences of each case can then be counted and 
multiplied by coefficients that reflect the quality of the flag. 




Total of Case 1: multiply by +2 
Total of Case 2: multiply by +1 
Total of Case 3: multiply by -1 
Total of Case 4: multiply by -2 
Total of Case 5: multiply by -1 
Total of Case 6: multiply by 0 
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This gives a total which should be positive for a grammar checker 
that is of some help to users. If the result is a negative total, then users 
should not use the program regularly to check their English. This type of 
numbered evaluation makes it easy to compare different products. 

4. Concluding remarks 

A bilingual grammar and style checker is a tool which will have a 
similar - if smaller - group of users to that of a word processor. It should 
therefore be easy to install, to learn and to use. All the tool’s features 
should be comprehensible to users who know how to use a word 
processor but who are not computer scientists. User-friendliness also 
includes such questions as use of the mouse, well-organized help options, 
speed, and a certain level of robustness against unexpected inputs by the 
user. Instead of trying to establish independent standards of user-friend- 
liness, the evaluator can assess it on the basis of personal impression. 

The check lists in an evaluation kit should cover all areas of 
compatibility, user-friendliness, quality of written documents and 
tutorials, messages, speed, and on-line help. To check the actual detecting 
and correcting facilities, "authentic" texts, together with a simple error 
message classification system, seem to be a viable solution to the problem 
of evaluation. This will allow the evaluator to arrive at a meaningful 
statement concerning the usefulness of the tool. 
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Les erreurs d'utilisation des temps anglais par les francophones : 
^bauche d'un v^rificateur Prolog * 

Corinne Tschumi 



R^sum^ 



Cette dtude porte sur I’analyse contrastive de Tutilisation des temps des 
verbes en anglais et en frangais. En particulier, les probl6mes des 
francophones sont examines. La formalisation en Prolog d’un certain 
nombre de cas difficiles s’inscrit dans I'optique d’un programme de 
correction pour les francophones dcrivant en anglais. Le but du programme 
est de recevoir des phrases en anglais contenant ou non des erreurs possibles 
de la part de francophones au niveau de I’utilisation des temps, et d’etre alors 
capable de reconnaitre ces phrases, d’identifier I'erreur et de proposer une 
correction, dventuellement aprfes interaction avec I’utilisateur. 

1. Introduction 

Ce travail conceme le probleme de I’utilisation des temps anglais par 
les francophones. Dans une premiere partie, plus thdorique, j'aborde ce 
domaine en commen 9 ant par une analyse contrastive de Tutilisation des 
temps en anglais et en fran 9 ais. Les probl^mes typiques d'utilisation des 
temps anglais par les francophones sont ensuite examines de mani^re plus 
detaillee. 

La deuxieme partie, plus pratique, prdsente la creation d'un petit 
programme dans le but (a) de controler des phrases anglaises, en portant 
une attention toute particuliere a I'utilisation des temps, et (b) de proposer, 
le cas 6ch6ant, une nouvelle forme verbale plus appropriee au contexte de 
la phrase. Cette seconde partie pr6sente la s61ection des erreurs que j'ai 
choisi de traiter et de formaliser en Prolog. Sont dgalement pr6sent6s les 
objectifs et les limites du programme, son architecture et son fonction- 
nement, ainsi que quelques ameliorations ultdrieures possibles. 



* Ce travail a fait I’objet d’un mdmoire pour I’obtention du Certificat de 3e cycle en 
linguistique informatique. University de Geneve, Juin 1991. Directeur de rndmoire : 
Eric Wehrli. 
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2. Le probl^me des temps anglais 

L’analyse contrastive gdnerale entre I'anglais et le fran^ais, ainsi que les 
nombreuses theories et approches de la traduction soulignent, derri^re les 
similitudes, les nombreuses differences entre ces deux systemes 
linguistiques, que ce soit au niveau phonologique, lexical, morphologique, 
syntaxique ou s6mantique, sans parler de la pragmatique. Dans le cadre de 
ce travail, je me suis intdress^e tout particulierement h la question de 
I’utilisation des temps des verbes anglais par les francophones, en me 
limitant aux temps de I’indicatif. 

Une simple enumeration des temps de I'indicatif k disposition dans 
chacune des deux langues revele deja qu'il ne peut y avoir une 
correspondance "un a un". Voici les temps de I'indicatif en anglais : 



- PRESENT SIMPLE 
he works 

- PRESENT CONTINU 
he is working 

- PRETERIT SIMPLE 
he worked 

- PRETERIT CONTINU 
he was working 

- FUTUR SIMPLE 
he will work 

- FUTUR CONTINU 
he will be working 



- "PRESENT PERFECT " SIMPLE 
he has worked 

- "PRESENT PERFECT " CONTINU 
he has been working 

- PLUS-QUE-PARFAIT SIMPLE 
he had worked 

- PLUS-QUE-PARFAIT CONTINU 
he had been working 

- FUTUR ANTERIEUR SIMPLE 
he will have worked 

- FUTUR ANTERIEUR CONTINU 
he will have been working 



Comparons-la h la liste des temps de I'indicatif du fran 9 ais : 



- PRESENT 
il travaille 

- IMPARFAIT 
il travaillait 

- PASSE SIMPLE 
il travailla 

- FUTUR 

il travaillera 



- PASSE COMPOSE 
il a travailU 

- PLUS-QUE-PARFAIT 
il avait travailU 

- PASSE ANTERIEUR 
il eut travailU 

- FUTUR ANTERIEUR 
il aura travailU 



Le classement de ces temps grammaticaux en trois grandes sections - 
temps du "present", temps du "passe" et temps du "futur" - permet 
egalement de mettre en evidence ces differences : 
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Anglais 


Fran 9 ais 


"present” 


PRESENT SIMPLE/CONTINU 
("PRESENT PERFECT" SIMPLE/CONTINU) 


PRESENT 


"pass^" 


PRETERIT SIMPLE/CONTINU 
PLUS-QUE-PARFAIT SIMPLE/CONTINU 
("PRESENT PERFECT" SIMPLE/CONTINU) 


PASSE COMPOSE 
IMPARFAIT 
PASSE SIMPLE 
PLUS-QUE-PARFAIT 
PASSE ANTERIEUR 


"futur" 


(PRESENT CONTINU) 

FUTUR SIMPLE/CONTINU 

FUTUR ANTERIEUR SIMPLE/CONTINU 


(PRESENT) 

FUTUR 

FUTUR ANTERIEUR 



Les diff6rences principales entre les deux systemes temporels sont 

done les suivantes : 

- Pour douze temps anglais, on en trouve huit en fran 9 ais. 

- Les temps anglais se classent en deux cat6gories, selon I'aspect : la 
forme SIMPLE et la forme CONTINUE. Ceci n'existe pas directement 
dans le systeme des temps en fran 9 ais, mais la nuance peut souvent etre 
rendue grace k I'utilisation d'expressions telles que : "etre en train de", "il 
y a ... qui" : 

II est en train de manger une pomme. (He is eating an apple.) 

II y a un chat qui traverse la rue. (A cat is crossing the road.) 

- Les temps du "futur" correspondent assez bien dune langue k I'autre. II 
faut cependant noter que le PRESENT fran 9 ais correspond souvent a un 
PRESENT CONTINU en anglais. 

- Les choses se compliquent au niveau des temps du "present", de par la 
presence en anglais du "PRESENT PERFECT", qu'il est difficile de 
classer entre les temps du "pr6sent" ou du "pass6", ce temps 6tant 
justement une combinaison des deux! 

- Quant aux temps du "pass6", il existe cinq temps en fran9ais contre six 
en anglais, et les temps des deux langues ne sont pas en correspondance 
lineaire. Ce point va etre illustre en detail dans la section suivante. 
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2.1. Illustration de la non-correspondance des temps fran^ais et anglais 

Afin d'illustrer h quel point un temps est loin d’avoir un et un seul 
equivalent dans I’autre langue, examinons d’abord un temps fran 9 ais, en 
Toccurrence le PRESENT et ses Equivalents possibles en anglais : 

(1) Chaque matin je bois un verre de jus d’orange. 

Every morning I drink a glass of orange juice. 

(habitude actuelle : PRESENT SIMPLE) 

(2a) Regarde, Tavion arrive! 

Look, the plane’s arriving! (€v€nement qui est en train de se passer au 
moment oii Ton parle, action en cours : PRESENT CONTINU) 

(2b) II part bientot pour TAngleterre. 

He is leaving for England soon. 

(intention, action dans un futur proche : PRESENT CONTINU) 

(3) Je travaille id depuis six mois. 

I have been working (have worked) here for six months. 

(action commencEe dans le passE et qui se poursuit encore au moment ou 
Ton parle, gEnEralement liEe k un compIEment de temps introduit par 
"depuis” : "PRESENT PERFECT" SIMPLE ou CONTINU) 

(4) Attends, je t’ouvre la porte! 

Wait, I’ll open the door for you! 

(offre de faire quelque chose pour quelqu’un d’autre : FUTUR SIMPLE) 

ConsidErons maintenant un temps anglais, par exemple le PRETERIT, 
et voyons quels peuvent etre ses correspondants fran^ais : 

(5) "Who is there?" he asked. But no one answered. 

"Qui va la?" demanda-t-il. Mais personne ne rEpondit. 

(temps de la narration passEe, surtout Ecrite : PASSE SIMPLE) 

(6) Your aunt arrived half an hour ago. 

Ta tante est arrivEe il y a une demi-heure. 

(temps de la narration passEe orale : PASSE COMPOSE) 

(7) He often worked at home when he was in London. 

II travaillait souvent h, la maison quand il Etait a Londres. 
(habitude dans le passE : IMPARFAIT) 

(8) I had never had any trouble with my car since I bought it. 

Je n’avais jamais eu d’ennuis avec ma voiture depuis que je 
I'avais achetEe. (rEfErence k un EvEnement passE antErieur k un autre : 
PLUS-QUE-PARFAIT) 



C. Tschumi 209 



2.2. Les erreurs typiques des francophones 

Les erreurs typiques des francophones suivantes ont 6te mises en 
Evidence : 

- non-utilisation de la forme continue : 

(9) * Don't disturb your father now, he works, [is working] i 

(Ne d6range pas ton p^re maintenant, il travaille.) 

- abus ou mauvaise utilisation de la forme continue : 

(10) * I am agreeing with what you're saying, [agree] 

(Je suis d'accond avec ce que vous dites.) 

(11) What does your father do? * He is working in a hospital, 
[works] 

(Que fait ton p^re? 11 travaille dans un hdpital.) 

- emploi du PRESENT au lieu du "PRESENT PERFECT" : 

(12) * They are married for ten years / since 1981. [have been 

married] 

(Ils sont mari6s depuis dix ans/depuis 1981.) 

(13) * This is the second time that I travel by plane, [have travelled]^ 

(C'est la deuxi^me fois que je voyage en avion.) 

- emploi du "PRESENT PERFECT" au lieu du PRETERIT : 

(14) Look, the neighbours have bought a new car. * They have 
bought it yesterday, [bought] 

(Regarde, les voisins ont achet6 une nouvelle voiture. Ils font achet6e 
hier.) 

- emploi du PRETERIT au lieu du "PRESENT PERFECT" : 

(15) * He already visited Great Britain, [has already visited]^ 

(II a d6j^ visit6 la Grande-Bretagne.) 



1 Chaque exemple est donn6 avec le temps erron6 correspondant k I'erreur possible du 
francophone (d*oii rast6risque). Le temps correct est donn6 entre crochets k la fin de la 
phrase. 

2 Les exemples (13) et (15) sont acceptables dans d’autres normes que I'anglais 
britannique 6crit. 





210 Erreurs d’ utilisation des temps anglais 



- emploi du PRETERIT au lieu du PLUS-QUE-PARFAIT : 

(16) * He knew her for a month when he asked her to marry him. 

[had known] 

(II la connaissait depuis un mois lorsqu'il lui demanda de I'^pouser.) 

- emploi du PRESENT au lieu du PRETERIT : 

(17) * It’s about time he marries her! [married] 

(II est temps qu'il I’^pouse!) 

(18) * Charles Dickens is born in 1812. [was bom] 

(Charles Dickens est en 1812.) 

- emploi du FUTUR au lieu du PRESENT : 

(19) * Give me a call when you will be back, [are] 

(Appelle-moi quand tu seras de retour.) 

A part les cas ci-dessus ou le temps choisi est clairement erron6, il y a 
6galement de nombreux cas ou un francophone pourrait s'etre tromp6, 
bien que le temps qu’il a choisi contribue tout de meme k former une 
phrase anglaise possible. Par exemple, le locuteur francophone qui 
prononce la phrase suivante : 

(20a) We played chess when they arrived, 

a pu vouloir dire : 

(21a) Nous jouions aux 6checs quand ils sont arrives, 

auquel cas il aurait du utiliser le PRETERIT CONTINU : 

(21b) We were playing chess when they arrived. 

Mais il peut avoir bien choisi son temps, si ce qu’il voulait dire 6tait : 

(20b) Quand ils sont arrives, nous avons jou6 aux 6checs. 

(= nous nous sommes mis k jouer aux Renees) 

2.3. Les correcteurs grammaticaux commerciaux 

Des tests effectu6s en juin 1991 sur les correcteurs grammaticaux 
disponibles ^ l’6poque pour I’anglais (Correct Grammar, Grammatik et 
PC Proof) ont rev616 que sur les phrases (22) ^ (26), qui contiennent toutes 
des fautes de temps correspondant h des erreurs trait6es par mon 
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programme (voir section 3), aucune erreur relative au temps n'^tait 
detect^e : ^ 

(22) * Max has seen Mary yesterday. 

(23) (*) Max is often eating apples.^ 

(24) (*) Max never gave Mary a book.^ 

(25) * Max knows Mary for ten years. 

(26) * Max knows Mary since 1980. 

3. Le programme 
3.1. Objectifs et limites 

Le programme present^ ici correspond h une premiere 6bauche de ce 
que pourrait etre un verificateur-correcteur de I’utilisation des temps 
anglais dans un texte 6crit par un francophone. Dans sa version actuelle, il 
est limite de par la taille tres r^duite de son lexique et la grammaire sous- 
jacente tres simplifiee. 

Le programme fait une analyse phrase par phrase, en operant tout 
d'abord une verification globale de la syntaxe. Une phrase mal form^e 
(syntagme mal form6, ordre des mots errone, etc.) est rejet^e k ce niveau- 
ci, car le programme n’arrive pas h trouver une structure syntaxique 
globale^. Par contre, si une structure syntaxique est trouv^e, les 
verifications concemant le temps peuvent se faire, donnant lieu le cas 
ech6ant a des messages qui soit d6terminent qu'il y a erreur et suggerent 
alors une correction, soit reperent une erreur potentielle et donnent un 
message d'avertissement. 

Le niveau de connaissance d'anglais suppos6 de Tutilisateur 
francophone potentiel est de quelques annees d’6tude d'anglais. Ceci est 



^ Bilingual W inproof, sorti depuis lors sur le march6, rep^re quant ^ lui des erreurs au 
niveau de Temploi des temps dans les phrases (22), (25) et (26). 

4 Les phrases (23) et (24) correspondent ^ des erreurs potentielles : elles peuvent etre 
erron^es selon ce que Tutilisateur a voulu dire (voir 3.3.6 et la note 13, page 219). 

5 Le rejet pur et simple des phrases agrammaticales serait inacceptable dans le cadre 
d’un veritable correcteur de texte. Un programme efficace et fonctionnel devrait etre 
capable de faire une analyse beaucoup plus subtile, en reconnaissant des constructions 
erron6es h. tous les niveaux, et en proposant ^ chaque fois une ou des corrections. Ceci 
n'est cependant pas mon but ici, puisque je me limite ^ donner des propositions de 
correction uniquement en ce qui conceme Tutilisation des temps dans la phrase. 
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important pour determiner le type de fautes k corriger, et egalement le 
genre de messages k afficher ^ 

L’objectif que je me suis fixe est done le reperage (et la correction) de 
certains cas typiques d’utilisation erronee des temps anglais par un 
francophone. Le type d’analyseur choisi permet Tana lyse d’une phrase a la 
fois. En ce qui conceme les temps, ceci me limite k devoir verifier le temps 
k I’interieur d’une seule phrase, et eiimine done les (nombreux) cas ou une 
erreur de temps ne peut etre detectee qu’en fonction des phrases 
environnantes. Void un exemple de ce type, que je ne peux traiter : 

(27) ’’What are you doing?” * ”I eat an apple.” 

D’autre part, mon analyseur, avant tout syntaxique, ne touche la 
semantique que par la presence de quelques traits semantiques sur les 
adverbes, les noms pouvant faire partie d’un complement de temps, etc. 
Cette absence d’analyse semantique eiimine k nouveau toute une serie de 
cas, tels que : 

(28) * He walked to school when he met her. [was walking] 

L’analyse des temps ne peut done se faire que dans des phrases ou un 
element de la phrase permet de determiner le temps. J’ai choisi de me 
concentrer sur les elements suivants : 

- les syntagmes adverbiaux temporels : 

- de temps passe revolu : last week, in 1980... 

- date (pas forcement passee) : at Christmas... 

- duree :for two years, since last Monday... 

- les adverbes - de frequence : often, never, always... 

- de temps passe revolu : yesterday... 



b Certains linguistes affirment que les regies traditionnelles sont imparfaites, montrant 
avec force exemples que Tusage est nettement plus complexe. Pierre Cotte (1987) cite 
ainsi plusieurs exemples qui contredisent la r^gle selon laquelle on n'utilise pas un 
"PRESENT PERFECrr* avec un complement de temps passe revolu tel que 'yesterday', 
mais plutot un PRETERIT. Malgre tout, ces cas restent des exceptions k I'usage general, 
et pour ma part je me suis basee sur les regies traditionnellement enseignees dans les 
ecoles. 
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3.2. Fonctionnement du programme 

Le programme, ecrit en Prolog, utilise un analyseur descendant bas6 
sur le formalisme DCG (Definite Clause Grammar, ou Grammaire de 
Clause D6finie). La technique utilis6e est d'analyser des phrases en 
contexte nul a I'aide de regies de r6-6criture (DCG), puis de proc6der ^ la 
verification du temps du verbe. 

Le programme se divise en plusieurs composantes : le lexique, la 
grammaire, les fiches de grammaire consultables, Talgorithme d'analyse, 
I’interface, les regies de verification des temps et les messages. 

3.2.1. Le lexique 

Le lexique, limit6 pour cette petite application, presente les mots sous 
forme de listes Prolog, qui sont transform6es automatiquement en clauses 
de HORN par l'interpr6teur Prolog, afin d'etre compatibles avec les regies 
de grammaire DCG. Ainsi, une entree lexicale telle que (29a) devient la 
clause de HORN (29b) : 

(29a) pronom(pronom(he), accord(3,masc,sg), cas(suj), []) —> [he]. 

(29b) pronom(pronom(he), accord(3,masc,sg), cas(suj), [], [helQ], Q). 

Les mots du lexique contiennent des informations morphologiques, 
syntaxiques et s6mantiques, selon les entr6es. Voici quelques exemples : 

art(art_indef(a), accord(_,_,sg), infos(cons)) --> [a]. 

adj(adj(last), accord(_,_,_), infos(cons), [temps, date_passe_revolu]) —> [last]. 
pronom(pronom(him), accord(3,masc,sg), cas(obj), []) — > [him]. 
nom(nom(hour), accord(_,neut,sg), infos(voy), [temps,duree]) --> [hour]. 
prep(prep(since), [temps, starting_point]) — > [since]. 

adv(adv(yesterday), pos([ini,fin]), [temps, date_passe_revolu]) --> [yesterday]. 
verbe(verbe(eats), accord(3,_,sg), infos(eat, pres(simple), transdir)) — > [eats]. 
aux(aux(has), accord(3,_,sg), infos(have, pres(simple), _)) --> [has]. 

3.2.2. La grammaire 

La grammaire se presente sous la forme de regies de r6-6criture DCG, 
accompagnees de certains tests. Une seule regie definit la phrase complete, 
qui doit etre reconnue pour etre accept6e. La phrase est compos6e, dans 
I'ordre, d'un syntagme adverbial temporel optionnel, d'un syntagme 
nominal (SN), d'un syntagme verbal (SV), et d'un autre syntagme adverbial 
temporel optionnel. 
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Le SN est defini par sept itgles, selon sa composition : pronom, nom 
propre, article + nom, article + adjectif + nom, adjectif cardinal + adjectif 
optionnel + nom, adjectif possessif + adjectif optionnel + nom, ou adjectif 
optionnel + nom au pluriel sans article. 

Le SV est defini par six regies, selon que le verbe est intransitif, 
transitif direct (suivi d un SN), bitransitif (suivi de deux SN ou d’un SN et 
d’un SP), "attribut" (suivi d’un SN ou d’un adjectif). Le groupe verbal est 
defini par douze regies, qui permettent d’identifier les differents temps de 
I’indicatif. 

Les syntagmes adverbiaux temporels sont d^finis par six regies, selon 
leur construction : 

- un adverbe seul (yesterday), 

- une preposition et un SN temporel (in two days), 

- un SN temporel suivi de la preposition AGO (one year ago), 

- un adjectif temporel suivi d’un nom singulier (last week), 

- un adjectif temporel suivi d’un ”nom propre” temporel (last Tuesday), 

- SINCE suivi d’un syntagme adverbial temporel (since yesterday), 

3.2.3. Les fiches de grammaire consultables 

Le programme comprend une serie de fiches de grammaire 
consultables par I’utilisateur : 

(a) Liste des temps de I'indicatif en anglais 

(b) Les formes verbales de I’indicatif 

(c) Les verbes irr^guliers 

(d) Comment traduire un present fran^ais 

(e) Comment traduire un imparfait fran^ais 

(f) Comment traduire un pass6 compost fran^ais 

(g) La traduction de DEPUIS et DEPUIS QUE 

(h) La traduction de PENDANT 

(i) Les temps avec FOR 

(j) Les temps avec SINCE 

(k) Les temps avec ALWAYS 

(l) Les temps avec les adverbes de frequence 

Lorsqu’un probl^me est detect^ par le v^rificateur, celui-ci propose une 
correction en faisant g6n6ralement reference a une fiche de grammaire. 
L’utilisateur peut ainsi avoir acces a une description plus d6taill6e du 
probl^me grammatical en question. ^ 
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3.2.4. L'algorithme d'analyse et Tinterface 

L'interface avec I'utilisateur a et6 rendu le plus convivial possible grace 
h une approche par menus. Le menu principal offre les possibilites 
suivantes : 

(1) analyser une phrase 

(2) afficher la structure syntaxique de la derni^re analyse 

(3) con suiter les fiches de graminaire 

(4) terminer 

L'analyse d'une phrase peut mener h la reussite de Tanalyse (aucune 
erreur d6tect6e), ^ l'6chec de I'analyse (phrase ne correspondant pas ^ la 
grammaire du programme) ou h une detection d'erreur (sure ou potentielle). 
Apres avoir fait analyser une phrase, Tutilisateur peut demander a en voir la 
structure syntaxique grace h I'option (2) du menu principal. Si plusieurs 
analyses sont possibles, elles sont toutes affich^es ^ I'ecran. La troisieme 
option du menu principal appelle un sous-menu qui affiche la liste des 
fiches de grammaire disponibles, permet a I'utilisateur d'en choisir une et 
affiche cette demiere a I'ecran. La demiere option permet de sortir du 
programme. 

3.3. Selection des erreurs trait^es pour la verification des temps 

Dans le but d'une detection d'erreur, les cas suivants ont 6t6 retenus J 

1) un syntagme adverbial de temps passe r6volu avec un temps autre 
que le PRETERIT, 

2) un syntagme adverbial indiquant une date avec un "PRESENT 
PERFECT", 

3) un syntagme temporel introduit par SINCE avec un PRESENT, un 
PRETERIT ou un FUTUR, 

4) un syntagme temporel introduit par FOR avec un temps incorrect,^ 

5) I'adverbe ALWAYS utilise avec un temps continu, 

6) un adverbe de frequence (autre que ALWAYS) utilise avec un 
temps continu^, ou avec un PRETERIT SIMPLE. 



7 Les cas 1)^4) correspondent a de v6ritables erreurs, alors que 5) et 6) repferent des 
erreurs potentieiles. 

^ Pour plus de details, voir point 3.3.4 ci-dessous. 

^ L'adverbe ALWAYS est trait6 s6par6ment car il accepte la forme continue pour une 
signification bien pr6cise, diff6rente des autre s adverbes de frequence (voir 3.3.5). 

2 
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Le tableau ci-dessous repr^sente les compatibilit6s entre les temps et 
les divers complements de temps : 

1 : syntagme adverbial temporel passe revolu : in 1920,... 

2: syntagme adverbial indiquant une date : on Monday,... 

3: syntagme adverbial introduitpar SINCE 

4a: syntagme adverbial introduit par FOR = depuis 

4b: syntagme adverbial introduit par FOR = pendant 

5: adverbe ALWAYS 

6: adverbes de frequence : often, never,... 





1 


2 


3 


4a 


4b 


5 


6 


present simple 


X 


0 


X 


X 


0 


0 


0 


present continu 


X 


0 


X 


X 


X 


(0) 


(0) 


pres.perf. simple 


X 


X 


0 


0 


(0) 


0 


0 


pres.perf. continu 


X 


X 


0 


0 


X 


(0) 


(o) 


preterit simple 


0 


0 


X 


X 


0 


0 


(0) 


preterit continu 


0 


0 


X 


X 


X 


(0) 


(0) 


plus-q-parf. simple 


X 


0 


0 


0 


0 


0 


0 


plus-q-parf. continu 


X 


0 


0 


0 


0 


(0) 


(o) 


futur simple 


X 


0 


X 


X 


0 


0 


0 


futur continu 


X 


0 


X 


X 


0 


(0) 


(0) 


futur ant. simple 


X 


0 


0 


0 


0 


0 


0 


futur ant. continu 


X 


0 


0 


0 


0 


io) 


io) 



Codes : o combinaison possible 

(o) combinaison plus rare, d'ou risque d'erreur 

X incompatibilite 

3.3.1. Les syntagmes adverbiaux de temps passe revolu 



J'ai considere quatre types de syntagmes adverbiaux de temps passe 
revolu : 



- adverbe : 

- last + nom 

- SN + ago : 

- in + date : 



yesterday, then 

last night, last Easter,... 

two years ago,... 

in 1291, in 1980... (-> 1993 



10 ; 



La combinaison d’un de ces corripiemeiits avec un verbe a un temps 
autre que le PRETERIT dedenche une des regies de verification des 
temps. Un message d’erreur indique alors qu’avec un tel complement de 



Cette date limite devant etre readaptee chaque ann6e. 



207 
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temps, on utilise g6n6ralement un PRETERIT, et la forme correspondante 
du verbe est propos6e. 

3.3.2. Les syntagmes adverbiaux indiquant une date 

Les syntagmes adverbiaux indiquant une date (pas forc6ment pass6e, et 
c’est 1^ la difference avec 3.3.1), sont de trois types dans le programme : 

- in + nom : in January, in March,... 

- at nom ou SN : at Easter, at two o'clock,... 

- on -k- nom : on Monday, on Tuesday,... 

Dans ce cas, une autre regie examine si le verbe est au "PRESENT 
PERFECT". Si c’est le cas, la forme du PRETERIT est propos6e. 

3.3.3. Les syntagmes temporels introduits par SINCE 

La preposition SINCE peut etre suivie d’un SN {since one o'clock, 
since February, since 1965), d’un adverbe {since yesterday) ou d’un 
syntagme adverbial {since last year). Si le temps de la phrase p rind pale est 
un PRESENT ou un FUTUR, un message donne le temps correct 
correspondant, c’est-a-dire respectivement un "PRESENT PERFECT" et 
un FUTUR ANTERIEUR. S'il y a un PRETERIT, on propose a I’utilisateur 
de le remplacer par : 

- un "PRESENT PERFECT" si le temps fran^ais correspondant est un 
PASSE COMPOSE : 

(30) * He ate three apples since one o’clock, [has eaten] 

(II a mang6 trois pommes depuis une heure.) 

- un PLUS-QUE-PARFAIT si le temps fran^ais correspondant est un 
IMPARFAIT : 

(31 ) * He knew her since Christmas [had known] (and at Easter he 

asked her to marry him). (II la connaissait depuis Noel...) 

3.3.4. Les syntagmes temporels introduits par FOR 

Les syntagmes temporels introduits par FOR sont de type for + SN : 
for two weeks, for an hour, for days,... La presence d’un syntagme temporel 
introduit par FOR repr6sente le cas le plus compliqu6 au niveau de la 
verification du temps. En effet, FOR peut signifier soit DEPUIS, soit 

208 .: 
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PENDANT, et la liste des temps corrects n‘est pas la meme dans les deux 
casll. Pour r^soudre cette ambiguitd, j’ai choisi le m^canisme de 
I'interaction avec I’utilisateur pour savoir quel sens ce dernier voulait 
donner ^ FOR, ce qui permet au programme de faire I’analyse temporelle 
coirecte. Ainsi, si I’utilisateur entre la phrase : 

(32) Max is living in London for three months, 

il rc 9 oit le message suivant : 

Uemploi des temps avec un complement de temps introduit par FOR 
est souvent different du frangais. [voir fiche (i)] 

Id, voulez-vous dire DEPUIS ou PENDANT? (tapez d ou p) 

S’il tape "d", il se verra proposer la forme au "PRESENT PERFECT" : 
has been living . 

FOR = DEPUIS n’acceptant que des temps parfaits, les corrections 
suivantes sont effectu6es : 

- PRESENT -> PRESENT PERFECT 

- PRETERIT -> PLUS-QUE-PARFAIT 

- FUTUR -> FUTUR ANTERIEUR 

Quant a FOR = PENDANT, les cas traites sont les suivants : 

- erreurs : 

- PRESENT CONTINU -> PRESENT SIMPLE 

- "PRESENT PERFECT" CONTINU -> PRETERIT SIMPLE 

- PRETERIT CONTINU -> PRETERIT SIMPLE 

- erreur potentielle : "PRESENT PERFECT" SIMPLE : 

Generalement, le "PRESENT PERFECT" SIMPLE avec FOR 
correspond a un PRESENT frangais avec DEPUIS. Pour traduire un 
PASSE COMPOSE frangais avec PENDANT, il vaut mieux utiliser le 
PRETERIT SIMPLE. 



1 1 Voir le tableau des compatibilitds, page 216, colonnes 4a et 4b. 
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3.3.5. L'adverbe ALWAYS 

Comme le tableau des compatibilites I'indique, avec l'adverbe 
ALWAYS aucun temps ne peut etre 6limin6 a coup sur. Tous les temps de 
I'indicatif sont possibles, mais les temps a la forme continue sont plus rares 
et comportent des nuances sp^cifiques : 

- irritation, jugement n^gatif : He is always talking in class! 

- r6p6tition ("tout le temps") : It's always raining. 

- ev6nement fr6quent mais inattendu : I'm always meeting Tom in town. ^2 

Me r6f6rant a I'objectif de d6part de consid6rer comme utilisateur 
potentiel un francophone apprenant I'anglais avec quelques ann6es d'6tude 
derriere lui, j'ai d6cide de proposer une mise en garde lorsqu'une forme 
continue a ete utilis6e avec ALWAYS. 

3.3.6. Les adverbes de frequence 

Les adverbes portant le trait "frequence" presents dans le lexique sont 
{always mis a part) : never, occasionally, often, rarely, seldom et 
sometimes. Ils sont rep6res par les regies de verification des temps 
lorsqu'ils sont utilises avec un verbe a la forme continue ou avec un 
PRETERIT. II s'agit dans les deux cas d'une erreur potentiel le.^3 

3.4. Possibilites d'extension 

Cette section presente diverses possibilit6s d'extension du programme 
grace a plusieurs ameliorations possibles : 



*2 Par opposition k : / always meet Tom in town, qui exprime un ev^nement habituel 
mais pr^vu, planifi6. 

13 En effet, la forme continue peut etre utilis^e dans des cas sp6cifiques, par exemple 
lorsque Ton met I'accent sur la dur6e de Taction, comme dans : When my husband 
comes back from work, / am often reading the newspaper. Mais le sens le plus courant 
de "je fais souvent quelque chose” se traduit par un PRESENT SIMPLE. Quant au 
PRETERIT, il est utilise uniquement pour faire reference k une action ou habitude 
pass^e et r^volue. Si Taction ou Thabitude en question se poursuit encore au moment de 
T^nonciation, il faut utiliser un "PRESENT PERFECT". Comparez : I have never eaten 
cucumber sandwiches (in my whole life) et / never ate cucumber sandwiches when / 
was in England. 
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- ajout de certaines expressions fig6es qui exigent un temps specifique 
different du fran 9 ais, telles que : 

It’s about time... (+ PRETERIT) 

It’s the second time that... (+ "PRESENT PERFECT") 

- verification des temps ^galement avec les complements de temps futur : 

- lorsqu’un PRESENT fran 9 ais se rend par un PRESENT CONTINU 
en anglais et ne correspond pas h un PRESENT SIMPLE : 

(33) * He conies next Tuesday, [is coming] 

Mais : (34) The film starts in half an hour. 

- lorsqu'un PRESENT fran 9 ais doit se rendre par un FUTUR : 

(35) * I send it to you next week. [I’ll send] 

(Je te Tenvoie la semaine prochaine.) 

- pas de FUTUR en anglais apres une conjonction de temps (as soon 
as, until, when ^"^ ) : 

(36) * I will call you as soon as I will have arrived, [have arrived] 
(Je t'appellerai dfes que je serai arrive.) 

- ajout des temps du conditionnel, du subjonctif et de I'imperatif. 

- ajout de structures syntaxiques plus complexes telles que : syntagmes 
nominaux complexes (contenant par exemple des SP), relatives, structures 
passives, phrases negatives, phrases interrogatives, completives, etc. 

Une approche differente serait de renoncer i une analyse syntaxique 
globale. L'analyseur se concentrerait principalement sur le rep^rage des 
formes verbales et des complements de temps. Ceci permettrait de faire 
toumer le programme sur des phrases beau coup plus complexes et 6viterait 
le rejet de certaines phrases uniquement parce que l'analyseur ne reconnait 
pas leur syntaxe. 



Pour autant que WHEN n'introduise pas une interrogative indirecte. 
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Une autre approche (incompatible avec Tapproche non-globale 
propos6e dans le paragraphe pr6c6dent!) serait d'introduire une analyse 
s6mantique de la phrase pour peimettre une analyse plus fine des temps, 
par exemple dans des phrases comme celles-ci : 

(37) * Since I’ve met him, he’s always been nice to me. [met] 

L’analyse devrait en outre permettre de differencier un SINCE 
temporel d’un SINCE causatif, I’exemple (38) etant tout a fait correct : 

(38) Since he's not here, let’s start without him. 

II faudrait 6galement gerer I’analyse de phrases contenant plusieurs 
complements de temps. Pour I’instant, un tel mecanisme n’a pas 
impl6mente, et les verifications du temps se font toujours dans I’ordre 
suivant : 1) avec I’adverbe a I’interieur du groupe verbal, 2) avec le 
syntagme adverbial initial, et 3) avec le syntagme adverbial final. Or ces 
complements peuvent dormer lieu a des commentaires et des suggestions 
de temps differents, voire contradictoires. II est done imperatif de 
determiner une strategie d'analyse dans le cas ou plusieurs complements de 
temps sont presents, peut-etre par un systeme de hi6rarchie ou de priorit6s. 

Enfin, il serait envisageable de parametriser le programme selon le 
niveau de I’utilisateur. Ce dernier pourrait avoir le choix d'activer ou de 
desactiver certains types d'erreurs selon ses connaissances linguistiques. 
Typiquement, un utilisateur avance ne voudrait peut-etre se faire rep6rer 
que les erreurs effectives, et non pas les erreurs potentielles, s’il domine 
bien I’usage des temps dans ces cas-la. 
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The ARCTA Prototype: An English writing tool and 
grammar checker for French-speakers ^ 

Corinne Tschumi, Franck Bodmer, Etienne Cornu, Francois 
Grosjean, Lysiane Grosjean, Natalie Kiibler, 
Cornelia Tschichold^ 



Abstract 



This paper presents a second language grammar checker for French 
native speakers who write in English. It was developed at the Language and 
Speech Processing Laboratory of the University of Neuchatel (Switzerland) 
and includes on-line writing tools (dictionaries, grammar helps, a translation 
tool for set expressions, a verb conjugator, etc.) and a grammar checker that 
corrects morphological, lexical and syntactic errors. False friends and other 
potential errors are dealt with in such a way as to reduce overflagging. 
Particular attention has been paid to second-language errors (as opposed to 
the ones made by native speakers) and to user-friendliness. 

1. Introduction 

The research presented here corresponds to a three-year project 
funded by the CERS (Swiss Committee for the Encouragement of 
Scientific Research) in which the Language and Speech Processing 
Laboratory of the University of Neuchatel developed a new second 
language grammar checker for French native speakers who write in 
English. This article gives a general overview of the whole project. More 
specific aspects are developed in the next three articles. In what follows, 
we first present the basic philosophy behind our prototype (called 
ARCTA, which stands for "Aide a la redaction et k la correction de 
textes anglais"). Next we explain how we analyzed a corpus of English 
texts written by French -speakers in order to identify and classify typical 
second- language (L2) errors^. Then, we focus on the different kinds of 
on-line tools included in the prototype and we present a special 



^ This research was supported by a grant from the Swiss CERS/KWF (2054.2). 

^ We would like to thank Jacqueline Gremaud-Brandhorst, Nicolas L6wy, Catherine 
Liechti, Tracy Mannon, Alain Matthey and Ann Morel who, in one way or another, 
contributed to this project. 

^ See the article by C. Tschumi & C. Tschichold (this issue). 
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mechanism used for treating potential errors such as false friends. 
Finally, we describe how grammar checking takes place, from text 
segmentation through word disambiguation^ and island syntactic pre- 
processing to error detection^^ and correction. 

2. The philosophy behind the prototype 

The aim of the ARCTA prototype is to facilitate the work of French- 
speakers when writing English. In developing the prototype, we have 
tried to keep in mind the following basic principles (although we have 
sometimes found we could not always apply them for technical reasons): 

a) detect and correct as many errors as possible; 

b) limit overflagging (false alarms) to a strict minimum; 

c) concentrate on the most frequent mistakes; 

d) only deal with widely accepted mistakes; 

e) interact with the user when necessary (but not too often); 

f) have a user-friendly interface; 

g) make use of up-to-date technology; 

h) use linguistic databases that can easily be updated. 

Limiting overflagging (point b) is particularly important in the 
context of L2 texts as stopping on a non-error may mislead the user 
whose mother-tongue is not English. In addition to helping users write a 
text and proof it, we have given them the opportunity to learn more about 
the use of English and improve their command of the language. To do 
this, we have offered them various help options during the writing 
process and the checking phase. 



^ See the article by F. Bodmer (this issue). 

^ See the article by N. Kubler & E. Cornu (this issue). 
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3. Corpus analysis and error typology 

At the onset of the project, we made up a typology of errors 
produced by French-speakers in English, To do this, we used our own 
knowledge of students’ mistakes, printed lists of errors in books or 
articles and the errors predicted by English-French comparative 
linguistics (Guillemin-Flescher, 1981; Kiibler, 1992; Vinay & Darbelnet, 
1977). In addition, and more importantly, we analyzed a corpus of texts 
(some 27,000 words) taken mainly from high school and business school 
written exams. The corpus was carefully analyzed and corrected by three 
native speakers of English (who all teach ESL) and the 2,862 errors 
found were used to complete our typology as well as give us the 
frequency of each error type. The corpus not only gave us a large 
number of errors but it also allowed us to work on real text with all of its 
inherent difficulties .5 

4. On-line writing tools 

A poll conducted among potential users helped us identify the various 
on-line tools that they would welcome. We finally chose the following for 
our prototype: 

a) an English monolingual dictionary, 

b) two bilingual dictionaries (French-English and English-French), 

c) a verb conju gator, 

d) grammar helps, 

e) information on difficult words, 

g) a translation tool for set expressions. 

The above tools have not yet been developed exhaustively but the 
access mechanisms together with a minimum amount of linguistic data 
have been included in the prototype. 



5 For a more detailed presentation of this aspect of our work, see the article by 
C. Tschumi & C. Tschichold (this issue). 
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5. Potential errors 

, After analyzing the errors in our typology and taking irito account 
the current state of computational linguistics, we acknowledged, like 
others have done before us (Payette & Hirst, 1992; Thurmair, 1990), that 
some mistakes could not be detected automatically. These include false 
friends, confusions and other lexical difficulties where an understanding 
of the meaning of the sentence (or paragraph) is necessary to determine 
whether there is. a mistake or not. The problem with most traditional 
grammar checkers is that they flag all occurrences of these potentially 
problematic words without being able to determine whether they are 
indeed used wrongly, thus triggering many annoying false alarms. In 
order to avoid this overflagging but to include these categories 
nevertheless, we decided to treat them separately. Thus, the user has a 
special "potential errors" check which lists all the potentially problematic 
words in the text. When he clicks on one of the items in the list, it is 
highlighted in the text and an information window appears which warns 
the user about the specific difficulties attached to that word. 

6. Error detection and correction 

Error detection and correction is done in several steps. First the text 
is segmented into sentences and lexical units. Spelling mistakes are 
corrected with a commercial spell-checker and then each word is looked 
up in a dictionary and receives a tag for each of its possible syntactic 
categories. (We are currently using an extract of CELEX that contains all 
the words in our corpus plus the most frequent words of English, 
totalling about 4,800 canonical entries.) The tagged text then goes 
through a word class disambiguator which gives each lexical unit only 
one syntactic category. This disambiguator is based on neural networks.^ 

In the next stage, syntactic analysis is undertaken. Since we are 
dealing with L2 texts that contain a large number of errors at all 
linguistic levels, a complete syntactic parse of the sentence is not an 
option. Instead, we have chosen island processing, starting with the 
identification of simple noun phrases with an NP parser based on 
stochastic methods. 



^ See the article by F. Bcxlmer (this issue). 
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The main phase of processing is achieved with finite state automata 
(Winograd, 1983). At the pre-processing level, automata group simple 
NPs into complex NPs, mark temporal NPs, locate the head of an NP, 
identify prepositional phrases such as temporal PPs and analyze verb 
forms for tense, mode, aspect and voice. This information is used by the 
next level of automata - the detection automata - which are specifically 
geared towards detecting erroneous sequences of words, morphological 
errors, problems of agreement (subject - verb, or within an NP), etc. 
Sometimes a single automaton cannot detect an error and we have to 
resort to filter automata before the actual detection automata. For 
instance, filter automata are used when we want to detect an error in 
different contexts but want to give the same correction message, or when 
we need to locate a correct sequence in order to eliminate it before 
detecting an error.'^ 

Whenever there is insufficient syntactic or semantic information, the 
user is asked for some information, such as "Are the words X-Y the 
subject of the verb Z?" Depending on the answer, we proceed with the 
detection or move on to another problem. Despite the fact that the user 
interaction option is both attractive and useful, we have tried to use it 
sparingly as it might bother the user a bit too much. 

The user is given a solution for correcting an error whenever 
possible but this is sometimes difficult, as we have not developed a full 
morphological analyzer. When error correction can take place 
automatically, we offer to either replace a word or several words with 
others, add a specific word (such as a missing article or preposition), 
delete one or several words, or permute two (groups of) words. When it 
is not possible, a message is produced stating that a particular mistake has 
been found and explaining, usually with an example, how the text can be 
corrected manually. An on-line grammar is available during the 
correction process. It is important to note that users remain in charge of 
their text at all times. They have the choice of accepting a proposed 
correction or not and of editing their text at any given moment. 



^ See the anicle by N. Kiibler & E. Cornu (this issue). 
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We have put a lot of emphasis on giving simple yet accurate 
rnessages. This is particularly important during the interaction phase 
where the question needs to be clear and precise and yet not contain 
grammatical jargon that is incomprehensible to a non-linguist. 

The prototype runs under Windows and the interface has been 
developed with Visual Basic. 

7. Conclusion 

Our prototype is the result of a careful analysis of the errors that are 
made by French-speakers when they write in English, of appropriate 
computational techniques and of a clear assessment of what a user needs 
and wants while writing and subsequently proofing his or her prose. 
Hopefully, it will enter a commercial development stage in the near 
future. 
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Selecting English errors made by French -speakers 
for automatic correction ^ 

Corinne Tschumi & Cornelia Tschichold 

Abstract 

In this article, we first present how we went about defining what we 
were going to treat as an error for detection and correction by a grammar 
checker of English for French-speakers. We then explain how we found 
errors-in great part through an in-depth analysis of a corpus of English texts 
written by French -speakers- and how we classified them in order to come up 
with a typology. Finally, we list the criteria that were used to select the errors 
that would be considered for automatic detection and correction. 

1. Introduction 

The work we present here is part of the ARCTA Prototype project 
which consists in the development of a second language grammar checker 
for French native speakers writing in Englishi. In this research, we deal 
with second language errors (L2 errors), more precisely errors in 
English texts written by French-speakers. These L2 errors are different 
from LI errors in English (made by English native speakers) in that 
certain typical monolingual mistakes do not appear whereas other types of 
mistakes do. Since English is not the users' mother tongue, certain 
mistakes, which are due to pronunciation for instance, are rarely made 
(e.g. the confusion between "you’re" and "your"). On the other hand, 
there are mistakes which a native speaker would not usually make, for 
example: 

- lexical confusions: *Chess is a slow play 

(the French noun jeu has two meanings: play or game), 

- difficult syntactic constructions: *The most he eats, the hungriest 



^ This research was supported by a grant from the Swiss CERS/KWF (2054.2). 

^ For a general presentation of the project, see the article by C. Tschumi, F. Bodmer, E. 
Cornu, F. Grosjean, L. Grosjean, N. Kiibler & C. Tschichold (this issue). 
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- problems of word order: *in the few last years, etc. 

At this stage of selecting errors, our work consisted of four different 
tasks which are developed in the sections below: 

- defining what we were going to consider an error, 

- finding the typical errors made by French-speakers in English, 

- classifying these errors, 

- selecting the errors that can be detected (and, if possible, corrected) 
automatically. 

2. What is an error? 

A linguistic error in a language is what is wrong according to a 
grammatical norm (e.g. *Why did she wrote this letter? ) or according to 
a given register {It ain't too late is not acceptable in a business letter, 
whereas it can very well be part of a dialogue in a novel). An error will 
usually strike a native speaker as being anomalous. This naturally led to 
the question of the norm we wanted to consider, since our definition of an 
error depended on it. First we had to choose between written and oral 
language. Then we had to opt for a geographical norm: British, 
American, or yet another. We finally chose the written American norm. 
The choice of a written rather than an oral language norm was easy in the 
context of written texts only. Since we were dealing with written L2 
texts, we adopted a standard norm, excluding colloquialisms that are too 
informal or at times vulgar. 

3. Collecting errors 

Having decided on the norm we wanted to use, the question became: 
how do we go about finding typical errors made by French-speakers 
when they write in English? We identified four possible sources, as can 
be seen in the diagram below: 
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English teachers’ 
intuition 



L2 corpus 



\ ^ 



ERRORS 



/ \ 



lists of errors 
(books, articles) 



English -French 
comparative 
linguistics 



- using the intuition of teachers of English who are familiar with 
their students' typical mistakes, 

- consulting published lists of French-speakers' mistakes, 

- collecting a corpus of texts written by French-speakers and 
correcting them, 

- trying to predict errors on the basis of English-French comparative 
linguistics. 

There are, however, problems with these approaches. The problem of 
completeness is a question that arises with all four approaches. 
Appealing to the intuition of English teachers raises the question of 
subjectivity. Is the error actually an error? Could it be that, on the 
other hand, a sentence accepted by the teacher contains an error? The 
analysis of a corpus leads to other questions: What kinds of texts 
should be examined and how many? What competence level in 
English should be considered? Examining lists of common mistakes also 
raises many questions, since the precise source of the errors is often not 
specified. Errors mentioned in these lists might have been taken from a 
corpus or they might have been constructed by the authors using their 
own intuition or have come from yet another source. Finally, 
comparative linguistics itself is not an ideal solution either, because a 
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grammatical point that is treated differently in French and in English 
does not necessarily lead to an error (especially if well-drilled at 
school) 2, 

The approach we adopted to collect errors consisted in combining the 
various methods described above. We started by mainly using English 
teachers’ intuition of French-speakers’ mistakes to which we added 
published lists of errors. This enabled us to compile a first draft of the 
typology. (The actual classification of the errors is dealt with in the next 
section.) 

We then collected a corpus of texts (containing some 27,000 words) 
written by native speakers of French, more precisely by students who had 
studied English for about 4 to 6 years. In order to have a variety of texts, 
we used maturite exams from both the gymnase and ecole de commerce 
(high school level) as well as some university exams {demi-licences). 
There were four different types of texts, namely essays, answers to 
questions, summaries and translations. 

Three ESL teachers, all English native speakers, were given the texts 
and asked to correct them separately. The results were used to revise and 
complete our typology and gave us information regarding error 
frequency. 

4. Classifying errors 

We built our typology of errors around seven main categories: 

1) Errors related to the graphical form of words. In this category 
we included, among others: 

a) spelling mistakes: 

- interferences with French {^adress, marchant), 

- non-words (*buisness, the f erst time), ^ 



^ See for instance H. Dulay & M. Burt, "Errors and strategies in child second language 
acquisition", reSOL Qwarrer/y, 8(2), 1974. 

3 Since our corpus was originally written by hand, we do not have typing mistakes. 
These are usually quite frequent in typed texts. 
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b) morphological errors {*certains childrens), 

c) mixtures of British and American spellings (? labour and honor). 

2-5) Errors related to different syntactic categories: adjectives, 

adverbs, nouns, verbs. 

Within each of these four categories, we subdivided errors according 
to morphology, lexicon, syntactic aspects (words that often precede or 
follow the category in question), punctuation, agreement, tense, and so 
on. 

6) Combinations of words which include phrases, collocations, dates, 
idioms... (*He seized the occasion, *on the 1 7 th June, * Arrange them by 
alphabetical order, *He never does his bed ) 

7) Utterance errors including negations {*She came not ), reference 
pronouns {*If the firm calls, tell her...), word order {*He asked me when 
are we leaving ), agreement (*There is people who think...), subordinate 
clauses {*He was sent abroad for learning Spanish, *This is all what is 
l^fi)^ prepositions (*/ have been reading since two hours ), syntactic 
constructions {*They will come, dont they?), etc. 

5. Selecting errors for detection and correction 

The selection of a specific error does not necessarily mean that the 
error will actually be corrected by the grammar checker. There are in 
fact two phases, or levels of processing, of an error: first, detecting the 
error (sometimes with the help of the user), and secondly, finding and 
proposing one or several corrections (again perhaps with the user). Some 
errors will only be covered in the first stage— leading to a warning 
message to the user-while others will be defined well enough to result in 
one or more propositions for correction. 

Whatever the final treatment of the error (detection only, or detection 
and correction), several criteria were taken into account when selecting 
the errors that were to be covered. One important factor was the 
frequency of the error which we derived from the corpus analysis. 
An equally important factor concerned the computational complexity 
involved in error detection and correction. This of course depends on the 
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computational tools chosen (in our case, a system based on automata for 
both error detection and a local grammatical analysis^). Computational 
complexity, which comes down to computational feasibility, is bordered 
by not detecting an error ("miss") on the one hand and flagging a non- 
error ("false alarm") on the other. Other factors that we took into 
account were the impact on comprehension of the error (Does the 
error make the sentence almost impossible to understand or can we 
interpret the message despite it?) as well as the scientific interest of 
the error (How is this error covered by other grammar checkers? If 
they can deal with it appropriately, is it worth spending much time on it, 
especially if we cannot do any better?). Finally, the last factor concerned 
the needs of potential users expressed in the responses to a survey we 
conducted. 

These factors provided us with a good basis for carefully selecting the 
errors we would attempt to detect and correct. 



^ See the article by N. KUbler & E. Cornu (this issue). 
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Using automata to detect and correct errors in the written 
English of French-speakers ^ 

Natalie Kiibler & Etienne Cornu 

Abstract 

This paper presents a second-language grammar checking approach 
based on a particular form of finite state automata. Three types of automata 
are used to track down an error: data extraction automata which build 
complex noun phrases and identify verbal groups, filter automata which look 
for specific contexts and detection automata which are used to find specific 
errors. 

1. Introduction 

The work we present here is part of the ARCTA Prototype project 
which consists in the development of a second language grammar checker 
for French native speakers who write in English^. In this article, we 
describe the formalism we have used to encode and detect errors. 

The general subject of error detection has developed rapidly over the 
last few years. However, even today’s best grammar checkers have severe 
limitations when dealing with texts written in a second language. Several 
questions must be answered in order to achieve the goal of detecting and 
correcting the errors people really make: Which errors should be dealt 
with? How should the linguistic data be organized? Which mechanism can 
be used? Tschumi & Tschichold (this issue) answer the first question and 
we will try to address the other two. 

Organizing the linguistic data in a grammar checker represents the 
first important step, especially in the field of second-language error 
detection. The errors that native speakers of French make in English must 
be taken into account when structuring this information. The specific 



^ This research was supported by a grant from the Swiss CERS/KWF (2054.2). 

^ For a general presentation of the project, see the article by C. Tschumi, F. Bodmer, E. 
Cornu, F. Grosjean, L. Grosjean, N. Kubler & C. Tschichold (this issue). 
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linguistic structures concerned influence the functionalities implemented 
in the prototype, and, conversely, the mechanism selected to detect errors 
has an impact on the organization of the data. 

The specific mechanism implemented in our prototype is based on a 
variation of finite state automata, i.e. the augmented transition networks 
first described by Woods (1970). They operate on two levels: on the 
terminal symbols, i.e. syntactic categories such as N (noun) or V(verb) 
that cannot be further analysed, and on two types of non-terminal 
symbols, noun phrases and prepositional phrases. 

2. Linguistic Data 

Our prototype contains a dictionary, feature lists and various 
automata that reflect how linguistic information has been organized. Basic 
data that concern syntactic category and inflectional information are 
stored in the dictionary. More specific information about words is either 
represented under the form of Boolean attributes or consists of tables 
containing different types of attribute-value pairs. 

2.1. Error-oriented language description 

Our model does not contain production rules such as S= = >NP VP 
that are found in grammar checkers based on a syntactic theory such as 
GPSG, LFG (Cornu, 1992) and ACFG (Vosse, 1992). We have 
determined (see Cornu, 1992) that with today’s parser technology a 
language description based on the structures present in ill-formed texts is 
better adapted to the problem. 

The errors that we process can be split roughly into three subclasses: 
morpho-syntactic errors, single word errors, and structural errors. We 
will present each type below and will then focus on structural errors. 

2.1.1. Morpho-syntactic errors 

Morpho-syntactic errors occur in situations where grammatical rules 
govern the morphological aspects of the words; they are therefore based 
on syntactic categories. Subject-verb agreement or erroneous adjective- 
noun agreement in the noun phrase belong to this subclass: 
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l.^He 

Pron[3rd,sing] 



collect 

V[plur] 



money 

NP 



for 

Prep 



his association 
NP 



2*These 

Detlplur] 



olds houses are expensive 

Adjf*plur] Nfplur] V Adj 



In (1), the verb should have the third person singular form collects; 
in (2), since adjectives are invariable in English, the adjective old should 
not take a plural ending. 

2.1.2. Single-word errors 

Errors that are based on specific lexical items and that cannot be 
associated to word classes are considered to be single-word errors. They 
are generated mostly by a lack of knowledge about exceptions or 
idiomatic structures in English (frozen or semi-frozen structures). 
Function words can also be used erroneously. The confusion between 
each and every represents one of these errors. 

2.1.3. Structural errors 

These errors concern subclasses of words that show the same 
syntactic behavior. Basic syntactic categories such as Verb are split into 
subclasses depending on their subcategorization. Noun predicates and 
adjective predicates can be distributed into subclasses as well. Errors 
occurring with one of these words can be found with all the other items 
that belong to the same subclass. Prepositions following a noun, an 
adjective, or a verb are very often incorrect. Lists containing the correct 
preposition can be included in the data: 

reason for; responsible for; drop in; conscious of; effect on. 

However, more complex information about the syntactic structures 
and the positions of the predicate’s arguments is needed. Report verbs and 
dative verbs generate errors in syntactic structures, as in: 

la. *You will ask questions to his friends 

lb. *They showed to each other... 

2a. */ explained him that I was poor myself 



ERIC 




238 Using automata to detect and correct errors 



2b. "^They will not allow to them to come 
3a. "^That permitted to become rich 
3b. "^Marian gave to him a message 

4a. *They remind us (about+E) those in Japan (£ = empty category) 

4b. *//e attribute her wonderful qualities 

5a. *//e told the poverty of his order 

5b. *We bought the suit to one of your competitors 

A formal description of these structures can be given in part in tables 
of the following form: 
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In our system, the syntactic information contained in these tables is 
represented by lists and by the automata that use these lists. One of the 
lists dealing with report verbs has the following format: 

admit Prep - Y Prep_Gov= to 

announce Prep = Y Prep_Gov= to 

tell Prep=N PrepjGov=0 

3. Error detection 

Before we describe error detection as such, we have to understand 
the steps that take place before the automata are executed. 

3.1 Preprocessing 

The basic text is tagged and disambiguated, which means that each 
lexical unit receives one and only one syntactic category^. Basic noun 
phrases are located by an independent mechanism. Here are some 
examples of basic NPs that must be found before the automata can be 
executed: 

[ the planet Mars] 

NP 



[The man] [whom] [I] saw gave [me] [those] 
NP NP NP NP NP 



[a house] of [crystal pillars] 

NP Ptep NP 

Information about these groups of words can be accessed at two 
levels: the NP level and the terminal units level (syntactic categories such 
as ART, ADJ and N ). For some compounds, detailed information cannot 
be accessed since the system uses a list of basic and very common 
sequences of words belonging to different syntactic categories: pronouns, 
prepositions, adjectives, adverbs and nouns. Here are some examples of 
such "frozen" expressions: 



^ See the article by F. Bodmer (this issue). 
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a lot of 

well-worn 
according to 
carte blanche 
in order to 



PRONOUN==> tagged as a single syntactic category, 
without the detailed analysis ART N PREP 

ADJECTIVE 

PREPOSITION 

NOUN 

CONJUNCTION 



Our automata operate on three levels. The first level is a 
preprocessing one and is concerned only with extracting new data from 
existing structures (Data Extraction Automata, DEA). The second level is 
optional and contains filter automata (FA). These identify sentence 
patterns in order to determine when to activate the third-level which 
contains detection automata (DA). The following diagram clarifies the 
organization of our automata: 



Level 1 Level 2 Level 3 



DEA 


A 

II 

II 


DAI 


DEA 




DA2 



3.2. Data extraction automata 



One of the tasks of first level automata consists in building complex 
noun phrases on the basis of simple ones that have been identified during 
the preprocessing stage. For the complex NP: a house of crystal pillars^ 
two basic APs have already been identified: 

[a house] of [crystal pillars] 

NP Prep NP 

The automaton used to build the complex NP in such a case has the 
following structure: 
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AUTOMATON NP_OF_NP 

(+NEWNP, ENV^CL::=NP^COMPL,NBR_NP::=$N) 

($P/=’of) 

[CAT=V, +PREPOS_V, PREP_GOV=>$P]*l 
<NP (NP_POS::=NP_l,NBR_NP=>$N)> 

@[IF=’of] 

<NP (NP_POS::=NP_2)> 

The anchoring - i.e. the starting point of the automaton - is set on the 
inflected form of. The system first looks to the right for an NP, then to 
the left of the preposition for another NP and to the left of that NP for a 
potential verb which could belong to one of the subclasses of 
prepositional verbs. If it finds one, the automaton then checks if the verb 
governs the preposition of. If it does, the automaton fails and nothing 
happens. If it does not, a complex NP is formed (+NEWNP) that inherits 
the NUMBER feature of the first basic NP. If the latter has other 
features, these are also passed on to the complex NP of a higher level. In 
this case, the first basic NP is taken as the head of the complex NP. 

A slight inconvenience of this approach is that some complex NPs 
will never be detected. If the verb can either be followed by of or 
function as a transitive verb, it might be possible that the preposition 
really belongs to a complex NP and not to the verb. In that case, the 
system misses a complex NP. However, it is usually the case that if a verb 
that allows of is followed by this preposition, the preposition is attached 
to the verb. 

The other function performed by data extraction automata consists in 
identifying verbal groups. These types of automata extract features such 
as the tense, aspect, and mode of each main verb found in the text. During 
this process, the automata must also determine whether verbs such as to 
have function as auxiliaries or as main verbs. The following examples 
illustrate this potential ambiguity: 

a. She has a lot of money in the bank => has is the main verb 

b. She has deposited a lot of money in the bank => has is the auxiliary 
of deposited 
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3.3. Filter automata 

The purpose of filter automata is to check the context of a sentence. 
Depending on the result of a filter automaton, one or several groups of 
third-level detection automata may be triggered. 

Filter automata function like a large net looking for specific contexts. 
Each filter automaton is associated with a group of detection automata 
that are concerned with one specific problem. 

. For example: 

AUTOMATON COMPL_V_FILTER_l 

@ [C AT= V,+COMPL_ V,+PPREP] 

A[iF=-that’l(CAT=PRON,+WH_PRON)] (R1=>$R) 

The success of this automaton means that a verb belonging to the list 
COMPL_y has been recognized and that either the inflected form that or 
a string from the WH PRON syntactic category has been found 
somewhere further on in the sentence. In this case, success allows a series 
of error detection automata to run, all of which are related to the 
mistakes occurring with this type of verb. 

3.4. Detection automata 

There are two types of detection, automata: some are triggered by 
specific filter automata, and the others are not. Except for this distinction, 
they have the same characteristics as the other automata. 

As mentioned earlier, some detection automata are associated with 
lists containing linguistic information. These lists contain words that are 
already in the dictionary; this allows the system to access directly the 
information needed when a specific automaton concerning a lexical item 
included in one of these lists is running. . Lists contain words that share 
similar semantic or syntactic features (e.g. ’^HUMAN) and may include 
specific syntactic properties for each item. For instance, the following list 
concerns dative verbs: 
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wordl 


feature l=valuel 


feature2=value2 


& DAT_V 


PREP_GOV 


SHIFT 


# give 


to 


+ 


# allow 


to 


+ 


# show 


to 


+ 


# address 


to 


- 


# attribute 


to 


- 



The automata used to check the structures of these verbs consist of 
one filter automaton that checks if the context contains one of these verbs, 
and then a series of detection automata that detect potential errors. The 
two filter automata below check if there is a verb that belongs to the 
dative verb list and whether that verb allows the "shift" transformation or 
not: 

AUTOMATON DAT^V_FILTER_1 AUTOMATON DAT_V_FILTER_2 

@[CAT=V,+DAT_V,+SH1FT] @[CAT=V,+DAT_V,-SHIFT] 

(R1=>$R) (R2=>$R) 

If the automaton DAT FILTER succeeds, then a series of 
defection autanala {SUFLU_PREP_pATV _1 and SUFLU_PREP_pATV_2) are 
launched. In the example below, the automaton checks whether a verb allowing a 
shift is built with a shift structure and with a superfluous preposition (e.g. 
^he gave to the secretary something). If that is the case, an error message 
is produced. 

AUTOMATON SUFLU_PREP_DATV_1 

@[CAT=V, +DAT^V, CF=>$E, PREP_GOV=>$P] 
[CAT=PREP,IF=$P] 

<SN @[ +HUM]> 

{ 

SCHEMAS 

MESSAGE " Avec cette structure, le verbe \u\$E\v se construit sans proposition; 
nous vous suggOrons de supprimer la proposition \u\$P\v." 



The automaton matches the ill-formed sentence shown below: 
gives to his friend a wonderful present 
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The assignment of a value to the register $P means that the system 
looks for the value of the preposition for the verb in question and puts it 
in the register. This value is then used during the correction process. 

If the automaton fails, the sentence is either correct or it contains 
another type of error. In that case, the next automaton, 
SU FLU PREP _DATV_2y is activated. If it fails, then the system goes on 
to another series of automata. 

If the first filter automaton fails but the second (DAT_V_FILTER_2) 
succeeds, the following detection automaton is activated. It checks 
whether a verb that doesn't allow the dative shift is shifted. 

AUTOMATON STRUCT_DAT^V 

@[CAT=V, +DAT_V,Prep_Gov=>$P, CF=>$E] 

<NP @[+HUM] (nRSTPOS=>$L,LASTPOS=>$R)> 

<NP (FIRSTPOS=>$X,LASTPOS=>$Y> 

The success of the automaton means that the following mistake has 
been detected: 

*//e attributes her friend wonderful qualities 

Another type of automaton can be used to check for the correct 
preposition. In the following example, the automaton checks if the 
preposition that is used is correct. 

AUTOMATON CHECK_PREP 

@[CAT=V, +DAT_V,Prep_Gov=>$P] <NP> [CAT=PREP,IF=>$R] 

<NP> ($R/=$P) 

Two registers are used here; with jtP, the attribute PrepjGov value 
is read from the verb list, and $R receives as a value the character string 
corresponding to the inflected form of the preposition. After the 
automaton has recognized a specific series of words, a condition is tested 
on one of the values. In a correct sentence, the preposition must be the 
same as the one that comes from the verb file. Thus, if they do not 
correspond ($R is different from $P)y an error is detected, as in: 

*//e attributes wonderful qualities at his friends 
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If the automaton fails, the sentence is considered correct and another 
automaton is tested. In this example, the series of detection automata 
triggered by the filter automata is quite small. In other cases (report 
verbs, for example), the series can be larger in order to look for every 
possible mistake. 

4. Conclusion 

It is clear that our approach is less efficient in detecting errors linked 
with complex grammatical structures. However, an important advantage 
is that the error detection rules contain enough relevant information 
within a single framework, such as basic syntactic structures and features 
specific to errors. In addition, the three execution levels allow us to 
organize the data in a way that the error detection automata can operate 
with a higher degree of confidence. This, in turn, greatly reduces the 
probability of false alarms. 

5. Bibliography 

CORNU, E. (1992): The Importance of Linguistic Theories in Grammar 
Checking, Workshop on natural language processing: first and second 
language correction of written texts, SGAICO, Neuchatel. 

GROSS M. (1975): Methodes en syntaxe, Paris, Hermann. 

KUBLER N. (1992): "Verbes de transfert en fran 9 ais et en anglais", 
Linguisticae Investigationes, 1 6( 1 ), 6 1 -97. 

VOSSE, T. (1992): "Detecting and correcting morpho-syntactic errors in 
real texts". Proceedings of the Third Conference on Applied Natural 
Language Processing, ACL, Trento. 

WOODS, W.A. (1970): "Transition network grammars for natural 
language analysis", CACM, 13(10), 591-606. 






236 



TRAN EL (Travaux neuchdtelois de linguistique), 1994, 21, 247-263, 



247 



DELENE: un d^sambiguisateur lexical neuronal pour 
textes en langue seconde ^ 



Franck Bodmer 



R^sum^ 



Dans cet article, nous pr^sentons un d^sambiguisateur lexical neuronal 
nonrim^ DELENE que nous avons int6gr6 dans le correcteur grammatical en 
langue seconde ARCTA d6velopp6 au Laboratoire TLP de lTJniversit6 de 
Neuchatel. DELENE est capable d’apprendre h d^sambigui’ser plus de 98% 
des ambigui’t^s d'un corpus L2 connu (corpus de textes anglais d'apprenants) 
en n'utilisant pour toute information que la syntaxe locale. En favorisant 
Tapprentissage de connaissances g6n6ralisables h des textes inconnus, 
DELENE obtient plus de 92% sur un texte de test L2. Les meilleurs r^sultats 
ont 6t6 atteints en 61argissant un ensemble de 14 categories grammaticales de 
base h 23. Une version hybride de DELENE, utilisant la morphologie en plus 
de la syntaxe locale, nous a permis de trailer le cas plus difficile des mots 
inconnus avec un taux d 'attribution de la cat6gorie correcte de 88% sur le 
meme corpus d'apprentissage L2, et de 82% sur le corpus de test. 

1. Introduction 

Dans cet article, nous presentons un desambiguisateur lexical 
neuronal nomme DELENE que nous avons int6gre dans le correcteur 
grammatical en langue seconde ARCTA developpe au Laboratoire TLP 
de rUniversite de Neuchatel^. 

Etant donne que le terme d’ambiguite lexicale est defini de fa^on tres 
vari6e dans la litt6rature specialisee, commengons par preciser que nous 
n’aborderons ici que le ph6nomene de Thomographie, c'est-^-dire des 
mots pouvant avoir plusieurs fonctions (ou categories) syntaxiques. 

La d6sambiguisation lexicale a fait son entr6e dans I'informatique 
linguistique dans les ann6es soixante, quand les premiers corpus sur 
support informatique ont 6te constitues. Les premiers d6sambiguisateurs 

^ Cette 6tude a pu etre entreprise et men6e h. bien grace k un subside de la CERS (no. 
2054.2). 

^ Voir I'article de C. Tschumi, F. Bodmer, E. Cornu, F. Grosjean, L. Grosjean, N. 
Kiibler & C. Tschichold (ce num^ro). 
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ont trhs couteux en temps h r^aliser et ne donnent probablement de 
bons resultats que sur le corpus pour lequel ils ont €t€ cr^es. Les nou- 
veaux d^sambiguYsateurs des armies quatre-vingt sont caract^ris^s par des 
algorithmes ayant pour but de diminuer I'effort humain pour les mettre 
en ceuvre, d’automatiser I'apprentissage, de faciliter leur adaptation h de 
nouveaux textes et d’abaisser le temps de calcul. Leurs performances 
plafonnent autour de 95% de mots correctement etiquetes (= etiquetage et 
d^sambiguYsation). DELENE est, dans cette lign^e, notre contribution 
dans le domaine neuronal. 

Depuis quelques annees seulement, le traitement du langage naturel 
(TLN) a trouve dans les r6seaux neuronaux (RN) un champ d'experimen- 
tation nouveau. Force est de reconnaitre que si, jusqu’a present, peu de 
syst^mes de TLN connexionnistes ont vu le jour, par contre ^ peu pres 
tous les niveaux d’analyse de la langue abordes par I'informatique linguis- 
tique classique ont fait I'objet de recherches dans les milieux connexion- 
nistes. Voici quelques exemples classes par niveaux d'analyse et poles 
d’int^ret : 

niveau morphologique : etiquetage des mots : Elenius & Carlson 
(1989) ; 

niveau syntaxique : les grammaires libres de contexte : Fanty 
(1986) ; th^orie du gouvemement et liage : Rager & Berg (1990) ; autres 
analyseurs connexionnistes : Nakagawa & Tatsunori (1988), Jain (1991), 
Faisal & Kwasny (1990) ; d^sambiguYsation lexicale : Anderson & 
Benello (1989), Eizirik & al.(1993) ; 

niveau s^mantique : assignation de roles th^matiques : 
Miikkulainen & Dyer (1991), St. John & McClelland (1990) ; scripts : 
Miikkulainen & Dyer (1991) ; d^sambiguYsation lexicale (s^mantique) : 
Eizirik & al. (1993) ; 

probi^me de representation : lexique connexionniste : Miik- 
kulainen & Dyer (1991) ; representation s^mantique : Veronis & Ide 
(1990), Scholtes (1991) ; representation de connaissances syntaxiques : 
Elman (1991) ; representation en general : Van Gelder (1989), Pollack 
(1990), Hinton (1990), Smolensky (1990) ; 
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traitement s4quentiel : Gasser & Dyer (1988), Elman (1989, 
1991) ; 

traitement symbolique : Derthick (1990), Touretzky (1990), 
Smolensky (1990) ; 

extraction de connaissances linguistiques : Crucianu & Memmi 
(1992), Elman (1989). 

Pourquoi avoir choisi les reseaux neuronaux pour la d^sambiguisation 
lexicale? L'approche neuronale, a travers I'apprentissage automatique, 
semble permettre d'6viter la construction manuelle des regies de d^sambi- 
guisation et n’utilise en memoire que la place pour Stocker la matrice des 
poids. Un inconvenient reside dans le temps de calcul lors du processus de 
desambiguisation ; il s’agit done de trouver un compromis entre des 
performances suffisantes et un temps d'attente raisonnable. La dispo- 
nibilite d’un grand corpus de textes anglais deja 6tiquetes, le corpus 
Brown, avec plus d’un million de mots, nous a pousses vers une m6thode 
avec apprentissage et evaluation automatique. Malgr6 le fait que des 
connaissances linguistiques diverses soient impliqu^es dans le ph6nom^ne 
de I’ambiguite lexicale, il semble que le mecanisme de la d6sambigui- 
sation repose en grande partie sur un comportement statistique au niveau 
des categories syntaxiques, ce qui, bien sur, ouvre la porte aux m6thodes 
neuronales. 

Le contenu de cet article est le suivant : Apres un rapide aper 9 u du 
phenomene de I'ambiguite lexicale et des travaux qui ont d6ja 6te r6alis6s 
dans ce domaine (section 2), nous expliquerons le fonctionnement de DE- 
LENE (section 3), nous pr6senterons les r6sultats obtenus (section 4) et 
nous terminerons par une version hy bride de DELENE permettant 
d’ajouter des connaissances morphologiques pour traiter les mots 
inconnus (section 5). 

2. La desambiguisation lexicale 

La desambiguisation lexicale est le processus de base de tout systeme 
de TLN devant traiter des textes de fa 9 on intelligente. De ce pr6-trai- 
tement depend le succes que Ton obtiendra dans les 6tapes ult6rieures. Le 
travail effectue lors du projet ARCTA a bien demontr6 qu'une 

O 
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d^sambiguisation correcte k 92% n’est pas suffisante pour la detection 
d’erreurs. 

L’ambiguit6 lexicale n'est pas un probl^me avec des donndes fixes. 
Selon la richesse du lexique qu’un systeme utilise, 'the’ sera non-ambigu 
(Det) ou ambigu (Det et Adv). A des sens rares ou provenant d’un do- 
maine particulier/sp6cialise comme par exemple to people ou to japan, 
peuvent s’ajouter des problemes de definition et de classement quand on 
se procure un lexique exteme : my dans un lexique sera adjectif possessif, 
mais il peut etre pronom dans un autre. Des problemes de terminologie 
de ce genre peuvent creer des difficult6s k un desambiguYsateur. 

Les connaissances linguistiques necessaires a la desambiguisation 
lexicale sont tres variees. Les plus utilisees sont la syntaxe locale et la 
frequence des categories d’une unite lexicale. Elies permettent de 
desambiguiser la majeure partie des cas. Des cas plus difficiles necessitent 
I’aide de la syntaxe globale et/ou de la semantique (ex.: I came before 
[CONJ] you did, et / came before [PREP] you). On peut faciliter le 
processus de desambiguisation en pre-filtrant des expressions figees ou 
semi-figees d’une part, et en utilisant un nombre plus ou moins important 
de categories syntaxiques d’autre part (de 30 ^ 150 dans les systemes 
connus). Enfin, le style du texte, sa fonction (titre, enumeration, etc.) et 
les competences de la personne qui redige sont autant de facteurs auxquels 
un desambiguYsateur doit pouvoir s'adapter. 

Etant donne que I’ambiguYte n’est pas un phenomene isoie, mais que 
Ton rencontre des sequences de mots ambigus, les systemes proposes 
abordent la desambiguisation de trois fa^ons differentes : soit 1) par la 
desambiguisation au mot par mot, en avan 9 ant dans la phrase de gauche a 
droite (ou de droite a gauche), depuis un terrain ”sur” (non-ambigu ou 
desambiguYse) vers un terrain ambigu (ex. TAGGIT de Greene & Rubin 
(1971)), soit 2) en procedant par paquet, c’est-^-dire en cherchant k 
desambiguiser une sequence de mots ambigus deiimitee par des mots non- 
ambigus (ex. CGC de Klein & Simmons (1963), CLAWS de Garside & 
al. (1987) ; VOLSUNGA de DeRose (1988) ; la methode stochastique de 
Church (1988) ; le module de Markov de Cutting & al.(1992)), soit 3) en 
commen^ant par attribuer une categorie preferentielle k chaque mot et en 
modifiant certaines categories par un ensemble de regies jusqu’^ 
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obtention d’un 6tat stable (ex. DILEMMA de Martin & al.(1988) et de 
Paulussen (1992) ; le systeme incr6mental de Brill (1992)). Parmi les in- 
convenients majeurs de ces systemes, il faut citer, pour la premiere ap- 
proche, qu’ils ne peuvent s’appuyer que sur une partie du contexte, et 
pour la deuxieme, qu’ils sont confrontes a un probleme d’explosion 
combinatoire. 

La plupart des systemes cites sont des taggers, c’est-a-dire des etique- 
teurs-d6sambiguisateurs. Les Evaluations qui sont publiees par leurs au- 
teurs (et qui toument generalement autour de 95%) indiquent pour cette 
raison le pourcentage de mots EtiquetEs et dEsambiguisEs correctement, et 
non, comme dans notre cas, le pourcentage de mots dEsambiguisEs 
correctement. Quant aux erreurs qui restent, il y a de fortes chances 
qu’elles soient dues h des difficultEs d’ordre sEmantique et a quelques cas 
de syntaxe globale et qu’elles ne puissent etre surmontEes pendant 
quelques annEes encore. 

3. Le dEsambigu'isateur DELENE 

Dans cette section, nous allons dEcrire I’approche neuronale que nous 
avons utilisEe pour construire le dEsambigu’isateur DELENE et expliquer 
son fonctionnement. En particulier, nous nous pencherons rapidement sur 
les phases d’apprentissage et de reconnaissance (ici, la reconnaissance est 
la phase de dEsambigu’isation) qui sont des caractEristiques des mEthodes 
neuronales. Une bonne introduction aux mEthodes neuronales est 
proposEe par Hertz & al. (1991). 

3.1 Un perceptron multicouches pour la dEsambigu'isation 

Parmi les diffErentes families de rEseaux neuronaux, nous avons 
choisi le perceptron multicouches (Rumelhart & al. 1986) pour effectuer 
la tache de dEsambiguisation. Celui-ci est composE de : 

- une couche d’entrEe d’unitEs appelEes neurones (d’apres le modele 
biologique simplifiE dont il dEcoule) dont le nombre est dEterminE de 
sorte que le probleme soumis au rEseau puisse etre codE ; 

- une couche de sortie qui code la rEponse du rEseau ; 

- au moins une couche intermEdiaire (dite cachEe). 
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Chaqiie neurone d’une couche donn6e est reli6 aux neurones de la 
couche suivante par un lien pond6r6. D’autre part, son activite est une 
fonction de I’activit^ des neurones relics h son entrde et des poids qui les 
relient. Pour pouvoir etre utilise sur une tache donn6e, le perceptron doit 
passer par une phase d’apprentissage au cours de laquelle on lui pr6sente 
des 6chantillons (ici, des homographes en contexte). Le r6seau modi fie ses 
poids (= il apprend) sur la base de la r6ponse correcte qu’on lui pr6sente 
(ici, la catdgorie correcte de I’homographe). Si le nombre d’echantillons 
est suffisamment grand, le r6seau parvient a g6neraliser ses 
connaissances, ce qui le rend utilisable sur des 6chantillons qu’il n’a pas 
encore vus. 

3.2 Le fonctionnement de DELENE 

DELENE est bas6 sur le modele d’ Anderson & Benello (1989), que 
nous avons modifie pour nos besoins. La ddsambiguisation se fait sur une 
fenetre de quatre mots, le mot ambigu ayant I’index i. La couche d’entree 
est done composee de quatre blocs et chaque unite a I'interieur d’un bloc 
represente une categorie syntaxique. Dans CATS(i), on active les catego- 
ries du mot ambigu, dans CAT(i-l) et CAT(i-2), la categorie des mots 
(d6sambiguis6s) de gauche, dans CATS(i+l) la ou les categories du mot 
de droite. 




(couclie de sortie) 
(couche cachee) 



(couche d'entree) 



Fig. 1 : schdma de fonctionnement de DELENE 



L’apprentissage a pour but d'en trainer la sortie CAT(i) a proposer la 
distribution probabilistique des cat6gories du mot i dans son contexte. En 
mode de ddsambiguisation, on choisit dans CAT(i) la categorie du mot i 
ayant la plus haute activation. 

DELENE est un pur modele de d6sambiguisation lexicale. II a 
I’avantage d’utiliser pleinement les possibilites d’un reseau neuronal dans 
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la mesure ou : 1) le phenomene de I’ambiguite (ambiguite du mot et de 
son contexte) peut directement etre represente, et 2) il apprend la tache 
de desambiguisation directement a travers des exemples. L’apprentissage 
peut se faire automatiquement en extrayant et presentant au reseau tous 
les cas d’ambiguit^ rencontres dans un corpus de phrases ou les categories 
syntaxiques sont connues et deja desambiguYsees. 

4. Les r^sultats 

Nous pr^sentons maintenant les resultats obtenus sous les diff^rents 
aspects qui nous ont semble interessants. 

4.1 Premiers resultats 

Comme pour les m^thodes statistiques et probabilistes, les methodes 
neuronales demandent de grandes quantites de textes pour dormer de bons 
resultats. Sachant par ailleurs que di verses methodes de desambiguisation 
lexicale avaient ete developpees sur la base du corpus Brown (la raison 
etant que ce corpus d’un million de mots est annote et desambiguise), 
nous avons commence par faire apprendre a DELENE des extraits du 
Brown. Pour cette premiere etape, nous avons utilise les 14 categories du 
prototype ARCTA (voir section 4.3). Les resultats indiquerent que le 
reseau pouvait apprendre a desambiguiser, mais qu’il restait bloque a un 
seuil insuffisant. Nous avons evalue DELENE sur un fichier 
d’apprentissage et un fichier de test et obtenu les resultats suivants, ou le 
pourcentage designe le taux de mots desambiguises correctement : 

fichier d’apprentissage Brown, 17268 cas ambigus, 14 cat.: 88.6% 

fichier de test Brown, 2201 cas ambigus, 14 cat.: 86.3% 

4.2 L'aspect langue seconde 

Avant de songer a ameiiprer cette premiere approche, nous nous 
sommes pose la question de savoir comment allait s’effectuer le passage 
du desambiguisateur du mode monolingue au mode bilingue. Nous avons 
envisage deux solutions : 

Solution 1 : adapter un DELENE monolingue au corpus L2 par un 
module suppiementaire. Avantage : contoumer la taille restreinte du 
corpus L2 (27’000 mots). Inconvenient : I’adaptation au mode bilingue. 
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Solution 2 : apprentissage de DELENE directement sur le corpus L2. 
Cette solution, plus 616gante que la premiere, est cependant basee sur 
deux hypotheses : a) la syntaxe particuliere utilis6e par les apprenants 
peut etre apprise par le perceptron de DELENE et b) les erreurs lexicales 
et syntaxiques dans les textes n’interfferent pas de fa 9 on majeure avec le 
processus de d6sambiguisation. Avantage : apprentissage directement en 
mode langue seconde. Inconvenient : la taille rdduite de notre corpus L2. 

Avant de poursuivre Tune ou I'autre de ces solutions, nous avons fait 
quelques tests pour essayer de cemer les difficult6s rencontrees en passant 
du mode monolingue au mode "langue seconde". 

Test 1 : Pour nous faire une idee de la degradation que subit 
DELENE en passant de textes monolingues (apprentissage) a des textes en 
langue seconde, nous avons evalu6 la premiere version de DELENE sur 
un corpus de test extrait du corpus L2 (il s'agit du corpus de test que nous 
allons rdutiliser jusqu’a la fin de cet article) : 

fichier de test L2, 1258 cas ambigus, 14 cat.: 81.2% 

La degradation obtenue, comparee aux 86.3% sur le fichier de test 
Brown, est d’environ 5% et apparait bien moins importante que ce que 
Ton pouvait attendre. En fait, en inspectant les erreurs faites par DELE- 
NE, nous avons constatd que seul un pourcentage restreint de ces cas 
6taient causes par des particularites de la langue seconde. 

Test 2 : Nous avons entraine DELENE directement sur le corpus L2. 
Pour pouvoir comparer les resultats entre les corpus Brown et L2, nous 
avons pris des extraits de taille comparable. Void les r6sultats : 



fichier d’apprentissage Brown, 6134 cas ambigus, 14 cat.: 89.7% 

fichier de test Brown, 1403 cas ambigus, 14 cat.: 85.7% 

fichier d’apprentissage L2, 5976 cas ambigus, 14 cat.: 93.5% 

fichier de test L2, 1258 cas ambigus, 14 cat.: 89.7% 



La comparaison indique clairement qu'un DELENE bilingue donne 
des r6sultats comparables a un DELENE monolingue pour autant que 
I'apprentissage se fasse sur un corpus appropri6. Les resultats plus sieves 
sur le corpus L2 peuvent meme 6tonner. Ils sont tres certainement dus 
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aux types de textes qui composent ce corpus ; il faut citer notamment des 
traductions qui ont pour effet de dupliquer certaines constructions de 
phrases et une variete de styles moins diversifiee chez les apprenants qui 
se reposent sans doute surtout sur des structures syntaxiques qu’ils 
connaissent. 

Les resultats obtenus lors de ces deux tests nous ont finalement 
pousses a opter pour la solution 2 et c’est celle-ci que nous allons utiliser 
dans le reste de cet article. 



4.3 Le nombre de categories syntaxiques 



Pour ameliorer les performances de DELENE, nous avons augment^ 
le nombre de categories utilisees dans le processus de desambiguisation 
(voir figure 2). Voici les categories de base, puis celles que nous avons 
ajoutees : 

Les 14 categories de base : Det, Adj, Adv, Nom, V, Prep, 
Conj, Pron, Gen (les formes du genitif, ex.: a hard day'^ work), Int 
(I’interjection), Num (les numeraux), NumO (les terminaisons des 
cardinaux, ex. lOr/i), Pet (les signes de ponctuation), Del (le delimiteur 
de phrase) ; 



Les categories ajoutees : AdvP (adverbe postpose comme dans : 
to take ojf). Be (les formes flechies de to be). Have (les formes flechies 
de to have). Mod (les modaux). Papa (les participes passes des verbes 
restants), DetPron (pronoms determinants), PersPron (pronoms 
personnels), Wh (pronoms wh). To (le r^?-infinitif). 



tBXtB ambigu(H cat.) 
tBXtB ambigu(23 cat.)- 



W 

T. 

w 

—I 

w 

Q 



Evaluation: 

tBXte desamb. (H cat.): exteme 

tBXtB desamb. (23 cat.): intame 



Fig. 2 : augmentation du nombre de categories : deux types d'evaluation. 

Le double but recherche lors de I'affinement des categories est d'une 
part de mieux caracteriser des sequences de categories et d'ajouter des 
contraintes syntaxiques supplementaires sur le contexte des homographes 
(ex.: Be, Have, Mod, Papa pour les formes verbales), et d'autre part de 
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mieux diff^rencier les comportements parfois tres varies d’une categoric 
en d61imitant un comportement precis par une sous-categorie. Ainsi, la 
d6sambiguisation d'homographes tel que Prep/Adv ou NonVV peut mieux 
etre apprise en les d6crivant comme Prep/AdvP et Nom/Papa. Enfin, h 
I’aide de cet affinement, nous avons mieux maitrise certaines particula- 
rit6s de notre lexique qui parfois genaient le processus de desambiguisa- 
tion. En introduisant, par exemple, la sous-categorie DetPron, nous avons 
pu isoler les pr6-determinants qui avaient ete classes dans le lexique 
comme pronoms. 

Chaque categoric ajout6e a contribu6 a ameliorer sensiblement les 
rdsultats, cependant que le reseau neuronal devenait de plus en plus 
important et toumait de plus en plus lentement sur notre Mac Ilci. Le 
processus d'affinement pourrait done etre poursuivi, en sous-categorisant 
par exemple des categories qui posent encore des problemes, mais nous 
nous sommes arretes a un stade ou les ameliorations devenaient de moins 
en moins perceptibles et ou les rdsultats en apprentissage se sont tres net- 
tement approches du seuil maximal accessible par la syntaxe locale. 

Avant de presenter ces resultats, precisons que nous avons fait la 
distinction entre une evaluation interne (23 cat.) et exteme (les 14 
categories de base), afin de pouvoir faire la comparaison avec les 
resultats precedents. L’evaluation interne est calculee d’apres un plus 
grand nombre de cas ambigus (ex,: that n'est pas ambigu pour 
revaluation exteme), dont certains sont faciles a apprendre et augmentent 
artificiellement les resultats. 

Evaluation interne : 



- fichier d'apprentissage L2, 7201 cas ambigus, 23 cat.: 96.6% 

- fichier de test L2, 1599 cas ambigus, 23 cat.: 92.2% 

Evaluation exteme : 

- fichier d'apprentissage L2, 5818 cas ambigus, 14 cat.: 96.3% 

- fichier de test L2, 1238 cas ambigus, 14 cat.: 92.2% 
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4.4. La dur4e de I'apprentissage 

Parmi les nombreux parametres qui ont une influence sur le fonction- 
nement d’un perceptron (citons notamment Tarchitecture et la topologie 
du perceptron, differentes constantes d’apprentissage, la taille des corpus 
d’apprentissage et de test, Tordre de presentation des situations k appren- 
dre, le hasard, etc.), la duree de I’apprentissage joue un role important. 

La fin de I’apprentissage ne peut g^neralement pas etre determinee 
par un critere precis et cela se passe plutot intuitivement : apres un 
certain nombre d’essais au cours desquels on a fait varier les parametres 
deja cites, on garde le reseau qui a donne le meilleur resultat. Cependant, 
si on laisse le perceptron apprendre jusqu’a ce qu’il donne le meilleur 
resultat sur le corpus d’apprentissage, nous ne pouvons garantir que la 
generalisation a des textes nouveaux soit optimale. En fait, si on ne 
Tarrete pas avant, le reseau va, dans la mesure du possible, apprendre les 
specificites du fichier d’apprentissage et sa capacite k g^n^raliser va 
decroitre. Pour remedier a cela, nous avons evalu^, tout au long de 
I’apprentissage, un corpus de test et nous avons garde la version du reseau 
qui donnait les meilleurs r^sultats sur celui-ci. Ce critere laisse, bien 
entendu, deux questions ouvertes : quel texte de test choisir et de quelle 
taille? 

Si on cherche a optimiser le reseau sur le corpus d’apprentissage, on 
peut par contre se faire une idee des performances du modele de 
DELENE, c’est-a-dire de la contribution de la syntaxe locale pure au 
processus de desambiguisation. Pour cela, nous avons etendu la duree de 
I’apprentissage au-dela du meilleur score obtenu a la section pr^c^dente : 

Evaluation interne et exteme : 

- fichier d’apprentissage L2 : 98.7% 

- fichier de test L2 : 92.0% 

Les 98.7% suggerent que le perceptron est parfaitement capable de 
realiser le modele de la syntaxe locale, car il est difficile de s’imaginer 
que ce modele puisse etre encore plus performant. La generalisation 
quant a elle n’a pas reussi a suivre le meme developpement et s’est 
quelque peu degradee, comme on doit s’y attendre. 
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5. Apprentissage de connaissances morphologiques 

Dans ce qui pr^cfede, nous sommes partis du fait que nous avions k 
traiter des mots ambigus dont les categories sont connues de notre 
lexique. La r^alite veut cependant que Ton soit sporadiquement confronte 
k des mots inconnus (soit parce que tout lexique est limits, soit parce que 
certains mots mal orthographies n’ont pas pu etre corriges par un 
correcteur orthographique). La solution classique procede a une analyse 
morphologique du mot pour proposer une ou plusieurs categories au 
processus de desambiguisation. Pour notre reseau, une autre solution 
consisterait, par exemple, k activer toutes les categories dans CATS(i) et a 
choisir parmi celles-ci la plus activee en sortie. Un test preiiminaire que 
nous avons effectue sur cette base et sur les memes textes a livre des 
resultats entre 50% et 60%, ce qui est tres nettement insuffisant. 



Pour notre approche, nous avons voulu savoir si un perceptron pou- 
vait utiliser des informations morphologiques et les combiner avec des in- 
formations syntaxiques. Pour cela, nous avons echange le bloc CATS(i) 
utilise jusqu'^ present par un bloc TERM(i) contenant la terminaison du 
mot d’une longueur de quatre lettres (voir figure 3 ci-dessous). Chaque 
lettre est codee sur quatre neurones et le codage ajuste par le reseau 
pendant I’apprentissage (pour plus de details, voir Miikkulainen & Dyer 
(1991) ; Bodmer (1992)). 




Fig. 3 : version avec bloc de terminaison 



Nous nous sommes attendus a ce que 
le reseau parvienne a coder les 
donnees alphabetiques dans le bloc 
TERM et qu'il apprenne a extraire, 
parmi les terminaisons de longueur 
fixe, les sequences de lettres pou- 
vant I'aider. Void, sur les memes 
textes qu’auparavant, les resultats 
obtenus avec ce modeie : 



fichier d’apprentissage L2, 7201 cas ambigus, 23 cat.: 88.6% 

fichier de test L2, 1599 cas ambigus, 23 cat.: 82.7% 

Ce resultat est satisfaisant surtout si Ton considfere que seules quelques 
formes fiechies dans un nombre restreint de categories peuvent etre 
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reconnues ^ partir de leur suffixe. Pour verifier que ce resultat n’etait pas 
du en majeure partie au contexte syntax ique, nous avons entrain^ et test6 
le meme reseau en maintenant TERM(i) ^ z6ro. Les resultats obtenus sur 
les memes textes etaient nettement moins bons : . 

fichier d’apprentissage L2, 7201 cas ambigus, 23 cat.: 53.2% 

fichier de test L2, 1599 cas ambigus, 23 cat.: 52,7% 

Ces chiffres soulignent Timportance du bloc TERM(i) dans son role qui 
est de proposer des cat6gories syntaxiques a la place du bloc CATS(i). 
Nous n’avons pas la place ici pour discuter la nature des connaissances 
morphologiques apprises par le reseau. Le lecteur interesse trouvera dans 
Elenius (1989) une etude comparable sur le suedois. 

6. Conclusion 

L’objectif de cet article etait de presenter un desambiguisateur lexical 
neuronal. Nous nous sommes principalement pench6s sur les r6sultats 
suivants : le nombre de categories k utiliser, la desambiguisation de texte 
en langue seconde et I’apprentissage de connaissances morphologiques. 

La premiere version du d6sambiguisateur est un modele neuronal 
utilisant uniquement la syntaxe locale sur une fenetre de quatre mots. 
Nous avons pu verifier qu’en apprenant a desambiguiser plus de 98% des 
cas d’ambiguit6 de notre corpus L2, ce modele rendait bien compte de 
I’aspect decisif de la syntaxe locale dans ce processus. Cependant, pour 
pouvoir utiliser notre desambiguisateur, nous avons retenu une version 
qui n’etait pas optimis6e sur le corpus d’apprentissage, mais sur un corpus 
de test. Les resultats, sur le corpus d’apprentissage et de test, sont 
respectivement de 93.5% et 89.7% en utilisant les 14 categories de base et 
de 96.3% et 92.2% en utilisant 23 categories. Cette am61ioration 
s’explique par le fait que la sous-categorisation des categories de base 
mene a un systeme ou chaque cat6gorie tend a n’exprimer qu’un seui 
comportement distinct, ce qui facilite I’apprentissage du reseau. 
L’obtention d’un corpus de taille plus grande serait un atout majeur pour 
am61iorer encore ces resultats. 

Ensuite, nous avons constat6 que notre desambiguisateur pouvait etre 
utilise tout aussi bien sur des textes d’apprenants que sur des textes de 
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locuteurs natifs, pour autant que I’apprentissage se fasse sur des textes 
correspondants. La syntaxe particuliere de ce corpus et les nombreuses 
erreurs lexicales et syntaxiques n’ont pas interf6r6 de fa 9 on significative 
avec le processus de d^sambiguisation. 

Enfin, nous avons cre6 une version hy bride de notre desambiguisa- 
teur en rempla 9 ant I’information cat6gorielle du mot ambigu par sa 
terminaison. Les r^sultats ainsi obtenus, soit 88,6% et 82.7%, soulignent 
qu’en grande partie, le r6seau peut apprendre a extraire de la terminaison 
d’un mot I’information reliee k ses categories syntaxiques et k m^langer 
cette information avec les connaissances d’un autre niveau. 
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IV« Resumes des autres publications du laboratoire 



Les articles et chapitres redigds par les membres du laboratoire 
depuis son debut et deja publics ou a paraitre sont pr6sent6s ci- 
dessous. Nous indiquons la r6f6rence et proposons un court r6sum6 
de chaque publication. 



BURKI-COHEN, J., F. GROSJEAN & J. MILLER (1989): "Base 
language effects on word identification in bilingual speech: Evidence 
from categorical perception experiments", Language and Speechy 
32(4), 355-371. 



The categorical perception paradigm was used to investigate whether French- 
English bilinguals categorize a code-switched word as French or English on the 
basis of its acoustic-phonetic information alone or whether they are influenced by 
the base-language context in which the word occurs, that is, by the language in 
which the majority of words are spoken. Subjects identified stimuli from computer- 
edited series that ranged from an English to a French word as either the English or 
the French endpoint. The stimuli were preceded by either an English or a French 
context sentence. In accord with previous studies (Grosjean, 1988), it was found 
that the base language had a contrastive effect on the perception of a code-switched 
word when the endpoints of the between-language series were phonetically marked 
as English and French, respectively. When the endpoints of the series were 
phonetically unmarked and thus compatible with either language, however, no 
effect of the base language was found. The current results provide confirming 
evidence that the perception of a code-switched word is influenced by the base- 
language context in which it occurs and, moreover, that the nature of the effect 
depends on the acoustic-phonetic characteristics of the code- switched word. 



GROSJEAN, F. (1987): "Vers une psycholinguistique du parler 
bilingue", in: LUDI, G. (Ed.), Devenir bilingue - Parler bilinguey 
Tubingen, Niemeyer. 

Dans la premiere partie de ce chapitre, nous dvoquons quelques iddes ou 
principes de base qui sous-tendent notre travail sur le bilinguisme : competence 
linguistique et communicative du bilingue, situations de communication, flux et 
reflux des langues, etc. Dans la deuxi^me partie, nous decrivons quelques dtudes 
expdrimentales qui visent k une meilleure comprehension de la production et de la 
perception du parler bilingue : etude spectrographique d'enoncds bilingues, 
experience de perception d'emprunts et de code-switchs, etc. Nous terminons en 
soulignant un certain nombre de prdrequis k la recherche sur le bilinguisme : besoin 
dune thdorie du bilinguisme qui soit en partie inddpendante de celle du 
monolinguisme, ndcessitd de distinguer clairement les diffdrentes situations de 
communication dans lesquelles se trouve le bilingue, et obligation de faire une 
psycholinguistique du parler bilingue qui puisse compldter et enrichir une 
linguistique gdndrale du bilinguisme. 
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GROSJEAN, F. (1987): "Lorsque HECTOR rencontre un 

psycholinguiste exp6rimentaliste que se disent-ils ?", in: 

JEANNERET, R. (Ed.)> Les teletheses de communication : rapport 
des sciences du langage a "Hector", num6ro special des TRANEL 
(Travaux Neuchatelois de Linguistique), 12, 13-28. 

Cet article comporte deux parties. Dans la premiere, I'auteur - un 
psycholinguiste exp6rimentaliste - pr6sente quelques reflexions ^ propos 
d'HECTOR et aborde les domaines suivants : la repartition des taches entre la 
teiethese et I'utilisateur, le traitement en temps reel, et les aspects ergonomiques du 
syst^me. Dans la deuxieme partie, consacree au synthetiseur d'HECTOR, des 
donnees issues d'une etude d'intelligibilite sont presentees et discutees. II ressort de 
cet article que I'ameiioration des teieth^ses de communication, et d'HECTOR en 
particulier, necessite un travail pluridisciplinaire auquel sont appeies k participer 
microtechniciens et informaticiens, linguistes et psycholinguistes, orthophonistes et 
educateurs, et, avant tout, les usagers eux-memes. 



GROSJEAN, F. (1988): "Exploring the recognition of guest words 
in bilingual speech", Language and Cognitive Processes, 3(3), 233- 
274. 

Bilinguals, that is those who use two languages in their everyday lives, move 
in and out of various speech modes when speicing to different interlocutors. When 
conversing with monolinguals, they speak one language and reduce the activation 
level of the other language, but when conversing with other bilinguals they choose 
a base language of interaction and often bring in the other language by either code- 
switching or borrowing. The aim of the present study is to explore how "guest 
words" (code-switches and borrowings) are processed by bilingual listeners when 
interacting with other bilibguals. Different types of English words (varying in 
phonotactic configuration and lexicon membership) were embedded in French 
sentences and were produced either as code-switches or borrowings. The gating 
paradigm (Grosjean, 1980) was used to present these words to French-English 
bilingual listeners so as to determine the role played by word type and language 
phonetics in the lexical access of guest words, as well as to uncover the underlying 
operations involved in the recognition process. Results showed that the 
phonotactics of a guest word, the presence or absence of a base language 
homophone, the language phonetics of the word, as well as the language that 
precedes the word, all play a role in the recognition process. An interactive 
activation view of bilingual word recognition is proposed to account for the results 
found in the study. 
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GROSJEAN, F. (1989): "La psycholinguistique experimentale : une 
science au carrefour de plusieurs disciplines", TRANEL (Travaux 
Neuchatelois de Linguistique), 15, 113-128. Egalement dans Annales 
de rUniversite de Neuchdtely 1990, 238-252 et dans Rassegna italiana 
di linguistica applicatUy 1992, 24(2), 1-16. 

La psycholinguistique se fixe comme objectif T6tude du iraitement du langage 
chez Tetre humain, c‘est-^-dire, la perception et la compr6henison, la production et 
la memorisation des diff^rentes manifestations du langage : langage ecrit, parole, 
communication en langue des signes. La psycholinguistique cherche h. comprendre, 
h decrire et h modeiiser les operations et les strategies, h. la fois linguistiques et 
cognitives, qui sont impliquees dans Tencodage et le decodage du langage, et cela h 
tous les niveaux du iraitement. L'article comporte les sections suivantes : definition 
de la psycholinguistique ; la demarche de la psycholinguistique experimentale ; les 
modules en psycholinguistique ; la psycholinguistique du bilinguisme ; la 
psycholinguistique de la langue des signes ; les defis futurs de la 
psycholinguistique. 

GROSJEAN, F. (1989): "Quelques reflexions sur le biculturalisme". 
Paroles d'or : Revue de Vassociation romande des logopedistes 
diplomeSy 4, 3-6. 

Tout individu appartient h. une serie de reseaux culturels qui se chevauchent 
plus ou moins et qui se regroupent en reseaux plus etendus qui eux-memes se 
regroupent en reseaux encore plus etendus. L'individu est done en quelque sorte 
"multiculturel". Dans cet article, nous evoquons la personne biculturelle et 
suggerons qu'elle se caracterise par trois traits distinctifs : elle participe ^ la vie de 
deux cultures, elle sail adapter son comportement, ses attitudes et son langage ^ un 
environnement culturel donne, et elle combine et synthetise les traits de chacune des 
deux cultures. Nous abordons ensuite le dilemme d'identit6 de la personne 
biculturelle et d6crivons Tenfant en devenir biculturel. 



GROSJEAN, F. (1989) (Ed.) Les sciences du langage a VUniversite 
de Neuchdtely TRANEL (Travaux neuchatelois de linguistique), 15, 



L'Universit6 de Neuchatel offre une place privil6gi6e aux disciplines qui 
appartiennent aux sciences du langage. Ce num6ro special des TRANEL compone 
cinq parties. La premiere est consacr6e aux unites administratives qui appartiennent, 
de pi^s ou de loin, aux sciences du langage. Le deuxi^me pr6sente les vingt-quatre 
enseignants-chercheurs qui travaillent dans ce domaine. La troisieme contient des 
articles qui refl^tent certains travaux de recherche de ces personnes. La quairi^me 
est consacr6e aux programmes des 6tudes et des examens des unites administratives 
et la cinqui^me pr6sente quelques renseignements et conseils aux nouveaux 
6tudiants. 
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GROSJEAN, F. (1989): ’’Neurolinguists, beware! The bilingual is 
not two monolinguals in one person", Brain and Language, 36, 3-15. 

Two views of bilingualism are presented: the monolingual or fractional view 
which holds that the bilingual is (or should be) two monolinguals in one person, 
and the bilingual or wholistic view which states that the coexistence of two 
languages in the bilingual has produced a unique and specific speaker-hearer. These 
views affect how we compare monolinguals and bilinguals, study language 
learning and language forgetting and examine the speech modes, monolingual and 
bilingual, that characterize the bilingual’s everyday interactions. The implications of 
the wholistic view on the neurolinguistics of bilingualism and in particular bilingual 
aphasia, are discussed. 



GROSJEAN, F. (1989): ’’The bilingual as a person", in: TITONE, R. 
(Ed.), On the Bilingual Person, Ottawa, Canadian Society for Italian 
Studies. 

In this chapter, we discuss the attitudes and feelings bilinguals have toward 
bilingualism, the inconveniences and the advantages of being bilingual and the 
differences some see between themselves and monolinguals. We mention some 
mental activities in bilinguals, such as counting, praying, thinking and dreaming, as 
well as the interaction of language and emotion, stress and fatigue. We attempt to 
answer a question often asked by monolinguals; Does the bilingual have two 
personalities or one? Finally, we discuss some bilinguals who are well known for 
their contributions to humanity and not for their bilingualism. 



GROSJEAN, F. (1990): "The psycholinguistics of language contact 
and code-switching: Concepts, methodology and data". Papers for 
the Workshop on Concepts, Methodology and Data, Network on 
Code-Switching and Language Contact, Strasbourg, European 
Science Foundation. 

This paper examines how psycholinguistics deals with the concepts that pertain 
to language contact and code-switching, the methodology used in experimental 
research and the data gathered by the psycholinguist. We briefly describe the aims 
and approaches of current psycholinguistics and then discuss at ^eater length the 
three topics that are the object of the workshop. We lean heavily on a research 
program we began in Boston, United-States and that we are continuing in 
Neuchatel, Switzerland. Our approach is not the only one possible within 
experimental psycholinguistics, but it illustrates to the outside researcher how a 
psycholinguist goes about studying language contact phenomena. 
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GROSJEAN, F. (1990): “Eire biculturel : une identite qui exclut la 
naturalisation ?“, in: CENTLIVRES, P. (Ed.), Devenir Suisse : 
adhesion et diver site culturelle des etrangers en Suisse, Geneve, 
Georg Editeur. 

L'hypoth^se propos^e ici est que, pour le biculturel, la naturalisation est une 
mani^re de renier, au moins symboliquement, une partie de son identity culturelle, 
identity qui combine et synth^tise les aspects et les traits des deux cultures 
auxquelles il appartient. Fa^onn^e au fil des ann^es, assum^e non sans difficult^s,. 
elle reflate ce qu'est devenue cette personne au contact de ces cultures. Toute action 
qui mettrait en danger cet ^quilibre durement acquis, telle que la demande de 
naturalisation, est k ^viter tant chez les membres de la premiere que chez ceux de la 
deuxi^me g^n^ration. 



GROSJEAN, F. (1991): "Le laboratoire de traitement du langage et 
de la parole de I'Universite de Neuchatel", Bulletin CILA, 50, 59-66. 
Egalement dans SI Information, 1991, 30, 13-16. 

Dans cet article, nous d^crivons les difteentes activit^s du laboratoire de 
traitement du langage et de la parole. Cr^^ en 1987, le laboratoire poursuit deux 
types de recherche. En premier lieu, il ^tudie le traitement naturel de la parole et du 
langage (Egalement appel6 psycholinguistique exp^rimentale), i savoir la 
perception, la comprehension et la production chez I'etre humain. En deuxi^me 
iieu, et en collaboration etroite avec certaines entreprises de technologie avanc^e, il 
entreprend des travaux dans le domaine du traitement automatique de la parole et du 
langage (linguistique-informatique), soit la synthase et la reconnaissance de la 
parole, Tanalyse automatique du langage, la correction de textes et la traduction 
assistee par ordinateurs. 



GROSJEAN, F. (1992): "Another view of bilingualism", in: 
HARRIS, R. (Ed.), Cognitive Processing in Bilinguals, Amsterdam, 
North-Holland. 

A particular view of bilingualism, the monolingual (or fractional) view, is first 
spelled out, and the negative consequences it has had on various areas of bilingual 
research are discussed. A bilingual (or wholistic) view is then proposed. According 
to it, the bilingual is not the sum of two complete or incomplete monolingual s but a 
unique and specific speaker-hearer. Four areas of research are discussed in this 
light: comparing monolinguals and bilinguals, language learning and language 
forgetting, the bilingual child and 'semilingualism', and the bilingual's speech 
modes. A description of research in mixed language processing concludes the 
chapter. 



GROSJEAN, F. (1992): "The bilingual and the bicultural person in 
the hearing and in the deaf world". Sign Language Studies, 11, 307- 
320. Version fran 9 aise: "La personne bilingue et biculturelle dans le 
monde des entendants et des sourds", Nouvelles pratiques sociales, 
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1993, 1, 69-82. Version allemande: "Der Zweisprachige und 
bikulturale Mensch in der hdrenden und in der gehdrlosen Welt”, 
Das Zeichen, 1993, 24, 183-189. 

If we define the bilingual as a person who uses two or more languages (or 
dialects) in everyday life, then most Deaf people who sign and who use the 
majority language regularly (in its written form, for example) are bilingual. Deaf 
bilinguals share many similarities with hearing bilinguals (their diversity, the 
perception they have of their own bilingualism, their use of various language 
modes, etc.) but they are also characterized by a number of specificities (the lack of 
recognition of their bilingual status, the maintenance over time of their languages, 
the competence they have in certain language skills, their varying patterns of 
language knowledge and use, etc.). As concerns the bicultural, whom we can 
define as a person who lives in two or more cultures, who adapts to each and who 
blends aspects of each, there is little doubt that many Deaf are indeed bilingual. 
Some of the implications for the bilingual and bicultural education of Deaf children 
that emerge from these considerations are discussed in the paper. 



GROSJEAN, F. (1993): "Le bilinguisme et le biculturalisme : essai 
de definition", TRANEL (Travaux neuchatelois de linguistique), 19, 
13-42. 



Cet article compone deux panies. Dans la premiere, qui traite du bilinguisme, 
nous pr^sentons d’abord quelques inflexions sur le sujet (definition du bilinguisme, 
competence communicative du bilingue, flux et reflux des langues, etc.). Nous 
evoquons ensuite les differents modes de communication dans lesquels se trouve le 
bilingue - le mode monolingue et le mode bilingue - et I’effet qu'exercent ceux-ci 
sur I’activite langagi^re du bilingue. Nous traitons enfin de I'enfant bilingue : 
I’acquisition simultanee ou successive qu’il fait des deux langues, les differents 
modes de communication qu’il rencontre, les mythes qui entourent les effets du 
bilinguisme sur son developpement cognitif. Dans la deuxi^me partie, qui traite du 
biculturalisme, nous evoquons la notion de culture et proposons une definition de la 
personne biculturelle. Nous abordons ensuite I’identite du biculturel, le devenir 
biculturel, et enfin, le comportement biculturel. 



GROSJEAN, F. (1994): "Individual bilingualism", in: The 
Encyclopedia of Language and Linguistics, Oxford, Pergamon Press. 

Few areas of linguistics are surrounded by as many misconceptions as is 
bilingualism. In this article, we concentrate on the adult and focus on the stable 
bilingual, that is the person who is no longer in the process of acquiring a second 
or third language. First, the bilingual person in terms of language knowledge and 
use is described. Then, the bilingual’s linguistic behavior when communicating 
with monolinguals and with other bilinguals is examined. A number of issues in the 
psycholinguistics and neurolinguistics of bilingualism are discussed and the article 
ends with a brief overview of the attitudes, behaviors and personality of the 
bilingual individual. 
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GROSJEAN, F. (1994): "Sign bilingualism: Issues", in: The 
Encyclopedia of Language and Linguistics, Oxford, Pergamon Press. 

Sign language bilingualism remains a poorly understood topic despite the fact 
that the great majority of signers, be they deaf, hearing-impaired, or hearing, are 
indeed bilingual. Their bilingualism is a form of minority language bilingualism in 
which the members of the linguistic minority, and more rarely, members of the 
majority, acquire and use in their everyday life both the minority language (sign 
language) and the majority language (in a signed, spoken, or written form). Sign 
language bilingualism can also involve the knowledge and use of two or more 
different sign languages, British and French Sign Languages, for example, but this 
is a less common type of bilingualism. 



GROSJEAN, F. (a paraitre): "A psycholinguistic approach to code- 
switching: The recognition of guest words by bilinguals", in: 
MILROY, L. & P. MUYSKEN (Eds.), One Speaker, Two 
Languages, Cambridge, Cambridge University Press. 

Code-switching has received considerable attention in recent years from 
linguists and sociolinguists, and it is no surprise, therefore, that researchers in the 
other fields of linguistics, such as psycholinguistics and neurolinguistics, should 
show interest in the phenomenon. In this chapter, we briefly review past work in 
the psycholinguistics of bilingualism and show how the language mode a bilingual 
is in when communicating (the monolingual mode or the bilingual mode) needs to 
be taken into account when studying language processing. We then focus on a 
panicular aspect of perception and comprehension in the bilingual language mode: 
the lexical access of code-switches and borrowings. We describe a number of 
studies aimed at getting a better understanding of this process and end with a model 
of guest word recognition. 



GROSJEAN, F. (k paraitre): "Living with two languages and two 
cultures", in: PARASNIS, I. (Ed.), Cultural and Language Diversity: 
Reflections on the Deaf Experience, Cambridge, Cambridge 
University Press. 

This chapter contains three parts. In the first, we describe the bilingual person 
and address such issues as bilingual language l^havior, the psycholinguistics and 
neurolinguistics of bilingualism, as well as the psychology of the bilingual 
individual. In the second part, we introduce the bicultural person and discuss topics 
such as bicultural identity and bicultural behavior. Finally, in the last part, we 
describe the Deaf bilingual and bicultural. 
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GROSJEAN, F., J-Y. DOMMERGUES, E. CORNU, D. 
GUILLELMON & C. BESSON Ql paraitre): "The gender marking 
effect in spoken word recognition", Perception and Psychophysics, 

This paper examines whether the recognition of a spoken noun is affected by 
the gender marking - masculine or feminine - that is carried by a preceding word. In 
the first of two experiments, the gating paradigm was used to study the access of 
nouns in French that were either preceded by an appropriate gender marking, 
carried by an article, or by no gender marking. In the second experiment, subjects 
were asked to make a lexical decision on the same material. A very strong 
facilitatory effect was found in both cases. The origin of the gender marking effect 
is discuss^ as is the level of processing involved - lexical or syntactic. 



GROSJEAN, F. & J. GEE (1987): "Prosodic structure and spoken 
word recognition". Cognition, 25, 135-155. 

The aim of this paper is to call attention to the role played by prosodic structure 
in continuous word recognition. First, we argue that the written language notion of 
the word has had too much impact on models of spoken word recognition. Next, 
we discuss various characteristics of prosodic structure that bear on processing 
issues. We then present a view of continuous word recognition which takes into 
account the alternating pattern of weak and strong syllables in the speech stream. A 
lexical search is conducted with the stressed syllables while the weak syllables are 
identified through a pattem-recognition-like analysis and the use of phonotactic and 
morphonemic rules. We end by discussing the content word vs. function word 
access controversy in the light of our view. 



GROSJEAN, F. & J. MILLER (a paraitre): "Going in and out of 
languages: An example of bilingual flexibility". Psychological 
Science, 

When bilinguals speak to one another, they choose a base language to interact 
in and then, depending on the need, code-switch to the other (guest) language for a 
word, a phrase or a sentence. During the perception of code-switches, there is a 
momentary dominance of base language units at the onset of the switch but it is 
unknown whether this base language effect is also present in production, that is, 
whether the phonetics of the base language carry over into the guest language. To 
test. this, French-English bilinguals retold stories and read sentences monolingually 
in English and in French, and then bilingually in French with English code- 
switches. Both the stories and the sentences contained critical words that began 
with unvoiced stop consonants, whose voice onset times (VOT) were measured. 
The results showed that the base language had no impact on the production of code- 
switches. The shift from one language to the other was total and immediate. This 
manifestation of cross-linguistic flexibility is accounted for in terms of a bilingual 
production model. 
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GROSJEAN, F. & B. PY (1991): ”La restructuration d’une premiere 
langue : I'integration de variantes de contact dans la competence de 
migrants bilingues", La Linguistique, 27, 35-60. 

L'objet de cette 6tude est d'explorer la restructuration de la compdtence d’une 
premiere langue dans une situation de bilinguisme prolongd. Nous montrons que 
meme une compdtence restde stable jusqu'^ I'age adulte peut etre restructuiee, et ce 
de mani^re importante, au contact d'une deuxi^me langue. Notre recherche porte 
sur des migrants espagnols de Neuchatel k qui nous avons demandd d’attester la 
presence et d'dvaluer I'acceptabilitd de certaines variantes espagnoles issues du 
contact entre I’espagnol, premiere langue, et le fran 9 ais, deuxiSme langue. Les 
r6sultats montrent que certaines variantes sont en voie d'intdgration dans la 
compdtence linguistique des migrants. Nous expliquons ces r^sultats en postulant 
que le degr6 d'intdgration d'une variante de contact ddpend de la position plus ou 
moins centrale du trait dans chacun des deux syst^mes linguistiques en presence. 



KLOSE, K., J. BUTTET SOVILLA, F. GROSJEAN & G. ASSAL 
(1992): ’’Perception categorielle et aphasie - donnees pr^liminaires a 
propos d’un nouveau test”, APHASIE und verwandte Gebiete, 2, 44- 
61. 



Apr^s une ddfinition et une presentation du phenom^ne de la perception 
catdgorielle, les rdsultats prdliminaires k un test construit h partir d’un continuum 
”camp-gant” et prdsentd h des sujets cer6bro-ies6s sont ddcrits. Les douze patients 
aphasiques testds prdsentent une fronti^re cat6gorielle nette, analogue k celle des 
sujets avec Idsion droite et des sujets-controle. Ce n’est done pas I’aphasie en tant 
que telle qui cause des troubles de la perception catdgorielle des phonemes. Par 
contre, les sujets aphasiques se distinguent significativement des autres sujets au 
niveau de la perception des extr6mit6s du continuum. 



KUBLER, N. (1992): ’’Verbes de transfert en fran^ais et en anglais”, 
Linguisticae Investigationes, 1992, 16(1), 61-97. 

L’objet de cette 6tude rdside dans la description et la comparaison des verbes 
exprimant le transfert d'un objet entre deux personnes en fran 9 ais et en anglais. 
Nous commen 9 ons par ddfinir la notion de transfert en I'illustrant avec les verbes 
du fran 9 ais et en essayant de ddlimiter le type de verbes que nous examinons. Aprfes 
une description des verbes anglais, nous poursuivons par la comparaison des deux 
langues pour terminer sur les applications possibles d'un tel travail. 
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MATTHEY, A. & F. GROSJEAN (1992): "L’apport potentiel de 
I’intelligence artificielle et du traitement automatique du langage 
naturel k une nouvelle version d’Hector”, TRANEL (Travaux 
Neuchatelois de Linguistique), 18, 51*66. 

Le laboratoire de traitement du langage et de la parole de TUniversit^ de 
Neuchatel a entrepris une 6tude sur Tapport potentiel de I'intelligence artificielle et 
du traitement automatique du langage naturel ^ une nouvelle version de la t616th^se 
de communication. Hector. Le present article, qui est le fruit de ce travail, 
comporte les parties suivantes : 1 . Les possibilit6s d'Hector - ses forces et ses 
faiblesses ; 2. L'intelligence artificielle et le traitement automatique du langage 
naturel ; 3. Vers une nouvelle version d'Hector. 



MONNIN, P. & F. GROSJEAN (1993): "Les structures de 
performance en fran9ais : caract6risation et prediction", L'Annee 
PsychologiquCy 9, 9*30. 

U est possible, grace ^ di verses taches experimentales, d'obtenir la structure de 
performance d'une phrase. Celle-ci est caracteris^e par un certain nombre de 
propriet^s fondamentales et peut etre pr^dite ^ I'aide d'algorithmes divers. Jusqu'^ 
present les recherches ont porte principalement sur I'anglais et nous nous toumons 
done dans cette 6tude vers les structures de performance du fran 9 ais. Dans la 
premiere partie nous caracterisons les structures obtenues h. I'aide d'une tache de 
lecture orale, et dans la seconde partie nous pr^disons ces structures au moyen 
d'algorithmes d6j^ existants (mais 16gerement modifies) et d'un nouvel algorithme 
que nous avons d^velopp6 sp6cifiquement pour le fran^ais. 



TSCHICHOLD, C., F. BODMER, E. CORNU, F. GROSJEAN, L. 
GROSJEAN, N. kCBLER & C. TSCHUMI (1994): "Detecting and 
correcting errors in second language texts". Computer Assisted 
Language Learnings 7(2), 151*160. 

A second language writing tool developed for French native speakers who 
have to write in English is described. It contains a number of help options 
(dictionaries, on-line grammar, etc.) as well as a grammar checker designed to track 
down the specific errors made by French speakers at the morphological and 
syntactic levels. The error detection and correction mechanism is based on finite 
state automata. Three types of automata are used: data extraction automata, filter 
automata and detection automata. The checker also contains a word class 
disambiguator based on neural networics and a stochastic noun phrase parser which 
identifies simple NPs. In order to help the checker identify the errors and propose 
an appropriate correction, a special set of automata trigger user interaction. The 
prototype runs under Windows. 
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V. M^moires et theses 

Nous presentons ci-dessous les memoires et les theses prepares, en 
partie ou en totalite, dans le cadre du laboratoire. 

1. Memoires termines 

Carole Besson 

L'effet de I'enchamement sur la reconnaissance des mots dans la 
parole continue. 

Franck Bodmer 

Systeme interactif de demonstration d’analyse du langage naturel. 
Franck Bodmer 

DELENE : un desambiguisateur lexical neuronal pour micro- 
ordinateur.^ 

Christine Cattin 

Informatique et orthophonie. 

Dominique Dubray et Veronique Kramer 

La methode verbo-tonale appliquee a un groupe d'enfants sourds : 
6tude experimentale. 

Murielle Gigandet 

L’apport de la coarticulation dans la perception de consonnes 
occlusives et constrictives. 

Delphine Guillelmon 

Le traitement du langage chez le bilingue. 

Kathrin Handschin 

L'influence de la langue de base dans la perception des altemances 
codiques : le cas de la consonne initiale du mot. 

Cendrine Hirt 

Prediction et perception de la prosodie : deux etudes 
experimentales realisees avec des sujets normaux et cer^bro-l^ses. 
Karin Klose 

Perception categorielle : sujets avec lesions cer^brales. 

Florence Lambert-Dutoit 

Perception categorielle et troubles du langage ecrit. 

Markus Leuenberger 

L'acces au lexique de code-switchs chez le bilingue : effets de la 
densite et du contexte. 

Catherine Liechti 

L'aide a la redaction en langue seconde : Evaluation d'un premier 
logiciel (Bilingual PC Proof). 



^ M6moire pr6par6 dans le cadre d'un cours postgrade en informatique k I'EPFL mais dirigd par 
F. Grosjean. 
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Pascal Monnin 

Etude sur la caract6risation et la prediction des structures de 
performance en fran 9 ais. 

Eliane Morel 

La perception de la liaison chez I’enfant : etudes experimentales. 
Adrienne Muller et Anne-Claude Preiaz 

Speech Viewer I : son utilisation en Suisse Romande 
Sonia Weil 

Choix de langue et altemahce codique chez le bilingue en situations 
de communications diverses : une etude experimentale. 

Cornelia Tschichold 

The evaluation of computer-assisted writing tools for non-native 
speakers of English. 

2. Theses en preparation 
Etienne Cornu 

Correction automatique des erreurs morphologiques et syntaxiques 
produites a recrit en langue seconde. 

Delphine Guillelmon 

L’acces au lexique chez le monolingue et le bilingue : I'effet du 
genre. 

Pascal Monnin 

L’evaluation de la comprehension orale chez les sujets aphasiques. 
Corinne Tschumi 

L’anglais ecrit des francophones : detection et correction 
automatique d'erreurs grammaticales. 

3. Memo ires en preparation 
Veronique Bagnoud 

La production et la perception des elisions en fran 9 ais. 

Isabelle Choffat 

Le role de I'affect dans I'acces au lexique. 

Nathalie Favre 

Le traitement des interferences chez les monolingues et les 
bilingues. 

Eliane Girard 

Les variantes de contact dans la competence des erifahts de migrants 
espagnols. 

veronique Kaufmann 

Analyse critique des tests de perception utilises en orthophonie. 
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Nicolas L6wy 

Implementation sur ordinateur d'un modele d'acces au lexique 
bilingue. 

Juri Mengon 

L'aide h la g6n6ration d'enonc6s dans les t616theses de 
communication. 

Sylvie Richard 

Perception et production des mots composes en fran^ais. 
Carine Vuilleumier et Anne von Kaenel 

Le Langage Parle Complete (LPC) : description et analyse. 
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VI. Mandats de recherche 

Une des taches confiees au laboratoire lors de sa creation dtait de se 
mettre h. la disposition de groupes extdrieurs h. Tuniversite (centres de 
recherche, entreprises, etc.) afin de collaborer a des projets communs. 
Cette activity est rdsumde ci-dessous. 



Intitule : 

Mandant : 
Collaborate ur(s) : 
Realisation : 


Evaluation du synth^tiseur de parole Synth^ 3. 
Electrel SA, Caen, France. 

F. Grosjean. 

Document : "Evaluation du synth^tiseur Synth6 3". 


Intitule : 

Mandant : 
Collaborate ur(s) : 
Realisation : 


Evaluation de I'intelligibilit^ de la voix de synthase Infovox. 
Infovox AB, Solna, Su^de. 

F. Grosjean. 

Document : "Le SA201/PC d'Infovox". 


Intitule : 

Mandant : 
Collaborate ur(s) : 
Realisation : 


Construction dun continuum acoustique. 

Division de neuropsychologie, CHUV, Lausanne. 

F. Grosjean, J.-Y. Dommergues. 

Continuum acoustique et document : "Fiche descriptive 
du continuum acoustique "camp-gant" obtenu par hybridation". 


Intitule : 

Mandant : 
Collaborateur(s) : 
Realisation : 


M^thodologie d'^valuation de produits issus des industries de 
la langue. 

IBM, Lidingd, SuMe. 

F. Grosjean. 

Document : "Evaluating natural language processing products" 


Intitule : 

Mandant : 
Collaborateur(s) : 
Realisation : 


Comparaison des synth^tiseurs de parole dElectrel et 
d'Infovox. 

Fondation suisse pour les t^l^th^ses, Neuchatel. 

F. Grosjean. 

Document : "Evaluation de deux synth^tiseurs de parole du 
ffan^ais : comparaison de SA201/PC d'Infovox et de Synthd 3 
d'Electrel". 


Intitule : 

Mandant : 
Collaborateur(s) : 
Realisation : 


Enquete sur les industries de la langue dans le Canton de 
Neuchatel. 

D^partement de l'6conomie publique, Neuchatel. 

F. Grosjean. 

Brochure : "Language and Speech Technology in Neuchatel, 
Switzerland". 


Intitule : 
Mandant : 

Collaborateur(s) : 
Realisation : 


Evaluation du reconnaisseur de parole RDP8-A. 

Fondation suisse pour les t6l6th^ses, Neuchatel; Syst^mes G, 
Lannion, France. 

F. Grosjean, J-Y Dommergues. 

Document : "Evaluation du syst^me de reconnaissance de 
parole RDP8-A de Syst^mes G". 
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Intituli : 

Mandant : 
Collaboratewis) : 
Realisation : 


Etude destin^e k pennettre une entree phon^tique Ibrs de 
Tutilisation de la t^l^th^se de communication "Hector”. 
Fondation suisse pour les t^l^th^ses, Neuchatel. 

F. Grosjean. 

Programme et document : "L'entr^e phon^tique avec Hector II 
conseils pour les utilisateurs". 


Intitule : 

Mandant : 
Collaborateur(s) : 
Realisation : 


Typologie des erreurs produites par les francophones qui 
r&iigent en anglais. 

ALP Systems, Cortaillod. 

N. KUbler, L. Grosjean, J.-Y. Dommergues, S. Gough. 
Document : "When French native speakers write English : The 
errors they make”. 


Intitule : 

Mandant : 
Collator ateur(s) : 
Realisation : 


Elaboration de bases de donn^es pour deux logiciels d'aide h. 
la redaction en langue seconde. 

ALP Systems, Cortaillod. 

N. KUbler, L. Grosjean, J.-Y. Dommergues, S. Gough. 
Bases de donn^es d'interf^rences de I'allemand en anglais et 
du fran^ais en anglais. 


Intitule : 

Mandant : 
Collaborateur(s) : 
Realisation : 


D^veloppement d'un interface pour la conversion de fichiers 
entre Wordcraft et UBSProof. 

ALP Systems, Cortaillod. 

A. Matthey. 

Programme de conversion en langage C. 


Intitule : 

Mandant : 
Collaborateur(s) : 
Realisation : 


Evaluation du logiciel UBSProof. 

ALP Systems, Cortaillod. 

F. Grosjean. 

Document : "The evaluation of UBSProof. 


Intitule : 

Mandant : 
Collaborateur(s) : 
Realisation : 


Evaluation de divers logiciels. 
Marc Tech SA, Neuchatel. 

A. Matthey. 

Rapports d’evaluation. 


Intitule : 

Mandant : 
Collaborateur(s) : 
Realisation : 


Elaboration d*une m^thodologie d'evaluation des aides h. la 
reaction. 

Lexpertise Linguistic Software, Vaumancus. 

F. Grosjean. 

Document : "The evaluation of writing tools." 


Intitule : 

Mandant : 
Collaboratewr(s) : 
Realisation : 


Evaluation de plusieurs logiciels d'aide h. la redaction de 
I’anglais (beta versions). 

Lexpertise Linguistic Software, Vaumarcus. 

F. Grosjean. 

Rapports d'evaluation. 
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IntituU : 

Mandant : 
Collaborateur(s) : 
Realisation : 



Intitule : 



Mandant : 
Collaborateur(s) : 
Realisation : 

Intitule : 

Mandant : 
Collaborateur(s) : 
Realisation : 



Intitule : 



Mandant : 
Collaborateur(s) : 
Realisation : 



Intitule : 

Mandant : 
Collator ateur(s) : 
Realisation : 



Intitule : 



Mandant : 
Collaborateur(s) : 

Realisation : 

Intitule : 

Mandant : 
Collaborateur(s) : 
Realisation : 
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Etude des mcxlifications ^ apporter k la t^l^th^se de 
communication "Hector". 

Fondation suisse pour les t^l^th^ses, Neuchatel. 

A. Matthey, F. Grosjean. 

Document : "L'apport potentiel de I'intelligence artificielle et du 
traitement automatique du langage nature! i une nouvelle 
version d'Hector". 

Travaux pr^paratoires en vue de I'int^gration du dictionnaire 
^lectronique DELAS sur le syst^me de gestion de base de 
donn^es Oracle. 

Lexpertise Linguistic Software, Vaumarcus. 

A. Matthey. 

Programmes Merits en Prolog. 

Comparaison de cinq aides k la reaction commercialis^es. 
Lexpertise Linguistic Software, Vaumarcus. 

F. Grosjean, J.- Y. Dommergues. 

Document : "A synopsis of the linguistic coverage of five writing 
tools." 

Realisation et Evaluation d un gEnErateur multi-mEdia du 
fran^ais (en collaboration avec TICP de I'UniversitE de 
Grenoble et Tlnstitut de phonEtique de I'UniversitE de 
Bruxelles). 

ACCT (Agence de coopEration culturelle et scientifique, Paris). 

P. Monnin, F. Grosjean. 

Document : "Comment mesurer les structures prosodiques du 
fran^ais ?" 

Propositions concernant les produits "Bilingual Proof et 
"French MaeProof . 

Lexpertise Linguistic Software, Vaumarcus. 

F. Grosjean, L. Grosjean, N. Kiibler, J. -Y. Dommergues. 
Documents : "Bilingual Proof : What it should contain" et "What a 
French MaeProof could look like". 

Elaboration de bases de donnEes pour les produits "Bilingual 
PCProof French-English" et "Bilingual PCProof German- 
English". 

Lexpertise Linguistic Software, Vaumarcus. 

J. -Y. Dommergues, N. Kiibler, S. Gough, L. Grosjean, 

F. Grosjean. 

Dix-sept bases de donnEes linguistiques. 

Evaluation de deux systEmes d'interrogation de bases de 
donnEes en langue naturelle. 

IBM, Lidingo, SuEde. 

F. Grosjean, A. Matthey. 

Trois documents : "The evaluation of natural language query 
systems", "Evaluation check lists for Natural Language" et 
"Evaluation check lists for Intellect". 
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Intitule : 

Mandant : 
Collaborateur(s) : 
Rialisation : 



Recherches bibliographiques. 

Lexpertise Linguistic Software, Vaumarcus. 

N. Kiibler, L. Grosjean. 

Rapport : "Bibliography for the usage and style section of a 
French writing tool" et fiches dtoillSes du contenu de quarante 
ouvrages. 



IntituU : 

Mandant : 
Collaborateur(s) : 
Rialisation : 



Enquete sur le th^me "Langage et technologie" pour 
I’exposition Heureka 1991. 

Zurcher Forum, Zurich. 

F. Grosjean. 

Rapport : "Le th^me d’exposition ’Langage et technologie"'. 



Intituli : 

Mandant : 
Collaborateur(s) : 
Rialisation : 



Elaboration d’automates pour la detection et la correction 
automatique d’erreurs en fran^ais. 

Lexpertise Linguistic Software, Vaumarcus. 

L. Grosjean, N. Kubler. 

S6rie d’automates. 



!ntituli : 
Mandant : 
Collaborateur(s) : 
Rialisation : 



Traductions techniques. 

Lexpertise Linguistic Software, Vaumarcus. 

N. Kubler, L. Grosjean. 

Traduction des messages d'aides et d’erreurs de I’outil 
"Bilingual Proof. 



Intituli : 
Mandant : 
Collaborateur(s) : 
Rialisation : 



Evaluation du reconnaisseur de parole d’lBM "Speech Client". 
L’Hebdo. 

F. Grosjean, C. Besson. 

Rapport : "L^ reconnaisseur de parole Speech Client". 
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